Wolfram Language

Processamento de texto e linguagem

Computação com listas de palavras multilíngues

Compare a distrubuição de números de caracteres por palavras em diferentes idiomas.

In[1]:=
Click for copyable input
languages = {"German", "English", "Italian", "Dutch", "Russian"};

Obtenha a lista disponível de palavras desses idiomas e agrupe-as em uma associação.

In[2]:=
Click for copyable input
words = Association[# -> WordList[Language -> #] & /@ languages];

Calcule o comprimento de cada uma dessas palavras.

In[3]:=
Click for copyable input
wordLengths = StringLength /@ words;

Estes são os comprimentos mínimos e máximos.

In[4]:=
Click for copyable input
MinMax /@ wordLengths
Out[4]=

Mostre histogramas sobrepostos de frequências relativas em cada idioma. Russo e inglês tem uma fração maior de palavras curtas, enquanto holandês e alemão tem a fração maior de palavras mais longas.

In[5]:=
Click for copyable input
Histogram[wordLengths, Automatic, "PDF", ChartLegends -> Automatic]
Out[5]=

Combine os histogramas para mostrar a contagem total de comprimento para os todos os idiomas juntos.

In[6]:=
Click for copyable input
Histogram[wordLengths, ChartLegends -> Automatic, ChartLayout -> "Stacked"]
Out[6]=

Exemplos Relacionados

de en es fr ja ko ru zh