Wolfram Language

Traitement de texte et de langues

Fréquences des lettres par rapport aux premières lettres

Démontrez que dans un dictionnaire anglais, les caractères les plus fréquents au début des mots ne coïncident pas avec les caractères les plus fréquents au niveau mondial.

Obtenez une liste de mots anglais courants à partir de WordList.

In[1]:=
Click for copyable input
Length[words = WordList[]]
Out[1]=

Prenez la première lettre de chaque mot.

In[2]:=
Click for copyable input
firstchars = StringTake[words, 1];

Comptez le nombre de mots commençant par chacune de ces lettres.

In[3]:=
Click for copyable input
Counts[firstchars]
Out[3]=

Visualisez leur prédominance relative en générant un WordCloud. Les lettres les plus fréquentes sont les consonnes s, c, p, d.

In[4]:=
Click for copyable input
WordCloud[firstchars]
Out[4]=

Calculez la prédominance relative de toutes les lettres de tous les mots en utilisant LetterCounts.

In[5]:=
Click for copyable input
allchars = LetterCounts[StringJoin[words], IgnoreCase -> True]
Out[5]=

Maintenant, les lettres les plus fréquentes sont les voyelles e, i, a.

In[6]:=
Click for copyable input
WordCloud[allchars]
Out[6]=

Exemples connexes

de en es ja ko pt-br ru zh