Язык Wolfram Language

Обработка текста и языка

Частота повтора букв по сравнению с частотой повтора первых букв

Покажите, что в английском словаре самые распространённые буквы в начале слов не соответствуют самым распространённым буквам в общем.

Получите список самых распространённых слов в английском языке при помощи WordList.

In[1]:=
Click for copyable input
Length[words = WordList[]]
Out[1]=

Возьмите первую букву каждого слова.

In[2]:=
Click for copyable input
firstchars = StringTake[words, 1];

Посчитайте количество слов, начинающихся с каждой буквы.

In[3]:=
Click for copyable input
Counts[firstchars]
Out[3]=

Визуализируйте относительное преобладание, сгенерировав WordCloud. Самые распространённые начальные буквы слов - согласные s, c, p, d.

In[4]:=
Click for copyable input
WordCloud[firstchars]
Out[4]=

Рассчитайте относительное преобладание всех букв во всех словах при помощи LetterCounts.

In[5]:=
Click for copyable input
allchars = LetterCounts[StringJoin[words], IgnoreCase -> True]
Out[5]=

Cамыми распространёнными буквами являются гласные e, i, a.

In[6]:=
Click for copyable input
WordCloud[allchars]
Out[6]=

Родственные примеры

de en es fr ja ko pt-br zh