Язык Wolfram Language

Обработка текста и языка

Вычисления с многоязычными списками слов

Сравните распределение количества символов на одно слово в разных языках.

In[1]:=
Click for copyable input
languages = {"German", "English", "Italian", "Dutch", "Russian"};

Получите доступные списки слов для этих языков и объедините их в ассоциации.

In[2]:=
Click for copyable input
words = Association[# -> WordList[Language -> #] & /@ languages];

Рассчитайте длину каждого из этих слов.

In[3]:=
Click for copyable input
wordLengths = StringLength /@ words;

Существует минимальная и максимальная длина.

In[4]:=
Click for copyable input
MinMax /@ wordLengths
Out[4]=

Покажите наложение гистограмм относительной частоты в каждом языке. Русский и английский имеют большую долю коротких слов, в то время как датский и немецкий имеют больше длинных слов.

In[5]:=
Click for copyable input
Histogram[wordLengths, Automatic, "PDF", ChartLegends -> Automatic]
Out[5]=

Объедините гистограммы, чтобы показать общий счёт длины слов во всех языках.

In[6]:=
Click for copyable input
Histogram[wordLengths, ChartLegends -> Automatic, ChartLayout -> "Stacked"]
Out[6]=

Родственные примеры

de en es fr ja ko pt-br zh