Язык Wolfram Language

Обработка текста и языка

Частота употребления слова во времени

Версия 11 представляет WordFrequencyData для получения информации о частоте употребления слова в печатных текстах на многочисленных языках. Используйте новую функцию для отслеживания тенденций использования слов во времени.

Сравните использование названий двух видео форматов между 1960 и 2000 годами.

In[1]:=
Click for copyable input
videoFormats = {"VHS", "BETAMAX"}; freqvideoFormats = WordFrequencyData[videoFormats, "TimeSeries", {1960, 2000}, IgnoreCase -> True];
In[2]:=
Click for copyable input
DateListPlot[freqvideoFormats, Filling -> Axis]
Out[2]=

Сравните использование названий методов транспортировки на протяжении двух столетий.

In[3]:=
Click for copyable input
transports = {"bus", "bicycle", "car", "train", "plane"}; freqtransports = WordFrequencyData[transports, "TimeSeries", {1800, 2000}, IgnoreCase -> True];
In[4]:=
Click for copyable input
DateListPlot[freqtransports, Filling -> Axis]
Out[4]=

Узнайте, когда слово "ручка" сталo могущественнее словa "меч".

In[5]:=
Click for copyable input
DateListPlot[ WordFrequencyData[{"sword", "pen"}, "TimeSeries", {1700, 2000}, IgnoreCase -> True], Filling -> Axis]
Out[5]=

Уменьшите временной промежуток, чтобы узнать, когда слово "меч" сново вошло в частое использование.

In[6]:=
Click for copyable input
DateListPlot[ WordFrequencyData[{"sword", "pen"}, "TimeSeries", {1950, 2000}, IgnoreCase -> True], Filling -> Axis]
Out[6]=

Родственные примеры

de en es fr ja ko pt-br zh