언어, 알파벳, 필기 문자의 특징 조사
버전 11을 통해 언어, 필기 문자, 알파벳에 대한 확장된 임베디드 지식에 접근이 가능해 졌습니다.
서로 다른 언어가 동일한 필기 문자 (혹은 필기 형식)를 사용하는 경우도 있지만, 보통 다른 알파벳 문자를 사용합니다. 이 예에서는 라틴 필기 문자를 사용하는 언어의 문자 수의 큰 가변성을 조사합니다.
라틴 필기 문자를 사용하는 알파벳의 목록을 얻습니다.
In[1]:=
alphabets =
EntityList[
EntityClass["Alphabet",
"WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
In[2]:=
Length[alphabets]
Out[2]=
131가지의 라틴 필기 알파벳 문자가 존재합니다. 그 중 일부를 표시합니다.
In[3]:=
RandomSample[alphabets, 15]
Out[3]=
각 알파벳 문자 목록을 저장하는 연상을 구축합니다.
In[4]:=
letters =
EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];
가장 짧은 알파벳은 12개로 구성된 모호크어입니다.
In[5]:=
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
Out[5]=
가장 긴 알파벳은 46개로 구성된 스로바키아어입니다.
In[6]:=
letters[Entity["Alphabet", "Slovak::kj62d"]]
Out[6]=
이 히스토그램을 통해 가장 일반적인 길이는 영어처럼 26자이지만, 26자의 알파벳 모두에 같은 문자가 포함되어있는 것은 아님을 알 수 있습니다.
In[7]:=
Histogram[Length /@ letters, 30]
Out[7]=
주어진 문자가 포함 된 문자의 수를 셉니다. 131개의 라틴 알파벳 모두에 포함되는 문자는 a, i, n 세개의 문자 뿐입니다.
In[8]:=
TakeLargest[Counts[Flatten[Values[letters]]], 10]
Out[8]=
모호크어는 문자 m을 포함하지 않으며, 문자 t를 포함하는 문자는 하와이어가 유일합니다.
In[9]:=
letters[Entity["Alphabet", "Hawaiian::p38r5"]]
Out[9]=