Язык Wolfram Language

Обработка текста и языка

Генерирование и проверка основ слов

Версия 11 включает в себя новые инструменты для поиска основ слов, избавления от множественного числа, склонения и т.д. Основа слова всё также несёт в себе значение изначального слова, но чаще всего сама по себе не является словом из словаря.

Сгенерируйте список из 30 случайных английских слов с помощью RandomWord.

In[1]:=
Click for copyable input
Short[words = RandomWord[30]]
Out[1]//Short=

Создайте их соответствующие основы слов с помощью WordStem.

In[2]:=
Click for copyable input
Short[wordstems = WordStem[words]]
Out[2]//Short=

Удалите слова, которые идентичны своим основам.

In[3]:=
Click for copyable input
list = DeleteCases[Transpose[{words, wordstems}], {w_, w_}];

Выделите синим цветом основы слов, которые также являются словами в английском словаре при помощи новой функции DictionaryWordQ.

In[4]:=
Click for copyable input
list = Replace[ list, {w_, sw_?DictionaryWordQ} :> {w, Style[sw, Blue]}, {1}];

Визуализируйте каждую пару в текстовой сетке.

код на языке Wolfram Language целиком
In[5]:=
Click for copyable input
TextGrid[ Prepend[ Partition[Flatten@list, UpTo[4]], {Style["Word", Bold, Italic], Style["Stem", Bold, Italic], Style["Word", Bold, Italic], Style["Stem", Bold, Italic]} ], Spacings -> {2, 1}, Dividers -> {{1 -> True, 3 -> True, 5 -> True}, {1 -> True, 2 -> True, -1 -> True}} ]
Out[5]=

Родственные примеры

de en es fr ja ko pt-br zh