Язык Wolfram Language

Улучшенное машинное обучение

Поиск распределения частоты употребления английских слов

Посчитайте употребление слов в Конституции США.

In[1]:=
Click for copyable input
text = ExampleData[{"Text", "USConstitution"}, "Words"]; wordCount = Values[Counts[text]];

Найдите простое распределение для подсчёта слов.

In[2]:=
Click for copyable input
e\[ScriptCapitalD] = FindDistribution[wordCount]
Out[2]=

Сравните полученное распределение с подсчётами слов.

код на языке Wolfram Language целиком
In[3]:=
Click for copyable input
Show[Histogram[wordCount, {0.5, 15.5, 1}, "ProbabilityDensity", PlotLabel -> "Word Count Distribution"], DiscretePlot[PDF[e\[ScriptCapitalD], x], {x, 1, 15}, PlotStyle -> PointSize[Large], PlotLegends -> {"e\[ScriptCapitalD]"}]]
Out[3]=

Родственные примеры

de en es fr ja ko pt-br zh