Язык Wolfram Language

Расширение базы знаний

Изучение характеристик языков, алфавитов и письменностей

Версия 11 предоставляет доступ к обширному встроенному знанию о языках, письменностях и алфавитах.

Различные языки могут разделять одну и ту же письменность (письменную систему), но в то же время использовать разные алфавитные знаки. Данный пример демонстрирует большое разнообразие в количестве письменных знаков в языках, которые используют латиницу.

Составить список алфавитов, которые используют латиницу.

In[1]:=
Click for copyable input
alphabets = EntityList[ EntityClass["Alphabet", "WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
In[2]:=
Click for copyable input
Length[alphabets]
Out[2]=

Всего 131 таких алфавита. Показать некоторые из них.

In[3]:=
Click for copyable input
RandomSample[alphabets, 15]
Out[3]=

Создать ассоциацию, содержащую список всех знаков каждого алфавита.

In[4]:=
Click for copyable input
letters = EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];

Самый короткий алфавит, могавк, содержит всего 12 букв.

In[5]:=
Click for copyable input
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
Out[5]=

Самый длинный алфавит, словацкий, содержит 46 букв.

In[6]:=
Click for copyable input
letters[Entity["Alphabet", "Slovak::kj62d"]]
Out[6]=

Данная гистограмма показывает, что самая частая длина алфавита - 26 букв, как, например, в английском языке, хотя не все алфавиты с 26 буквами имеют одинаковые буквы.

In[7]:=
Click for copyable input
Histogram[Length /@ letters, 30]
Out[7]=

Сосчитать, сколько алфавитов содержат заданную букву. Только три буквы присутствуют во всех 131 алфавитах, а именно a, i, n.

In[8]:=
Click for copyable input
TakeLargest[Counts[Flatten[Values[letters]]], 10]
Out[8]=

В языке могавк нет буквы m, а гавайский язык является единственным, в котором нет буквы t.

In[9]:=
Click for copyable input
letters[Entity["Alphabet", "Hawaiian::p38r5"]]
Out[9]=

Родственные примеры

de en es fr ja ko pt-br zh