Wolfram 语言

文本和语言处理

字母频率与首个字母

显示在英文字典中在单词开头出现频率最高的字母与出现频率最高的字母并非一致.

WordList 获取常用英语单词列表.

In[1]:=
Click for copyable input
Length[words = WordList[]]
Out[1]=

提取每个单词的首字母.

In[2]:=
Click for copyable input
firstchars = StringTake[words, 1];

计算由这些字母开头的单词的总数.

In[3]:=
Click for copyable input
Counts[firstchars]
Out[3]=

通过生成 WordCloud,可视化其相对比例. 频率最高的首字母为辅音 s、c、p、d.

In[4]:=
Click for copyable input
WordCloud[firstchars]
Out[4]=

LetterCounts 计算单词中全部字母的相对优势.

In[5]:=
Click for copyable input
allchars = LetterCounts[StringJoin[words], IgnoreCase -> True]
Out[5]=

此时频率最高的字母为元音 e、i、a.

In[6]:=
Click for copyable input
WordCloud[allchars]
Out[6]=

相关范例

de en es fr ja ko pt-br ru