Вычисления с многоязычными списками слов
Сравните распределение количества символов на одно слово в разных языках.
In[1]:=
languages = {"German", "English", "Italian", "Dutch", "Russian"};
Получите доступные списки слов для этих языков и объедините их в ассоциации.
In[2]:=
words = Association[# -> WordList[Language -> #] & /@ languages];
Рассчитайте длину каждого из этих слов.
In[3]:=
wordLengths = StringLength /@ words;
Существует минимальная и максимальная длина.
In[4]:=
MinMax /@ wordLengths
Out[4]=
Покажите наложение гистограмм относительной частоты в каждом языке. Русский и английский имеют большую долю коротких слов, в то время как датский и немецкий имеют больше длинных слов.
In[5]:=
Histogram[wordLengths, Automatic, "PDF", ChartLegends -> Automatic]
Out[5]=
Объедините гистограммы, чтобы показать общий счёт длины слов во всех языках.
In[6]:=
Histogram[wordLengths, ChartLegends -> Automatic,
ChartLayout -> "Stacked"]
Out[6]=