Procesamiento de texto y lenguaje

Frecuencia de letras vs letras iniciales

Muestre que en un diccionario de inglés los caracteres más frecuentes al inicio de las palabras no coinciden con los caracteres más frecuentes globalmente.

Obtenga una lista de palabras comunes en inglés desde WordList.

In[1]:=
Click for copyable input
Length[words = WordList[]]
Out[1]=

Tome la primera letra de cada palabra.

In[2]:=
Click for copyable input
firstchars = StringTake[words, 1];

Cuente el número de palabras que inician con cada una de estas letras.

In[3]:=
Click for copyable input
Counts[firstchars]
Out[3]=

Visualice su predominancia relativa generando un WordCloud. Las letras más frecuentes son las consonantes s, c, p, d.

In[4]:=
Click for copyable input
WordCloud[firstchars]
Out[4]=

Calcule la predominancia relativa de todas las letras en todas las palabras usando LetterCounts.

In[5]:=
Click for copyable input
allchars = LetterCounts[StringJoin[words], IgnoreCase -> True]
Out[5]=

Ahora las letras más frecuentes son las vocales e, i, a.

In[6]:=
Click for copyable input
WordCloud[allchars]
Out[6]=

Ejemplos relacionados

de en fr ja ko pt-br ru zh