Wolfram Language

Processamento de texto e linguagem

Gere e verifique palavras base

A versão 11 inclui novas ferramentas para encontrar palavras base, eliminando plurais, inflexões, etc. A palavra base continua carregando o significado da palavra original, mas frequentemente não será a forma da palavra que aparece no dicionário. Este exemplo mostra casos de ambas situações.

Crie uma lista com 30 palavras aleatórias em inglês com RandomWord.

In[1]:=
Click for copyable input
Short[words = RandomWord[30]]
Out[1]//Short=

Construa suas respectivas formas base com WordStem.

In[2]:=
Click for copyable input
Short[wordstems = WordStem[words]]
Out[2]//Short=

Elimine as palavras que são idênticas as suas formas base.

In[3]:=
Click for copyable input
list = DeleteCases[Transpose[{words, wordstems}], {w_, w_}];

Destaque em azul as formas base que também são palavras que se encontram em dicionários de inglês utilizadas pela nova função DictionaryWordQ.

In[4]:=
Click for copyable input
list = Replace[ list, {w_, sw_?DictionaryWordQ} :> {w, Style[sw, Blue]}, {1}];

Visualize cada par em uma tabela de texto.

mostre o input completo da Wolfram Language
In[5]:=
Click for copyable input
TextGrid[ Prepend[ Partition[Flatten@list, UpTo[4]], {Style["Word", Bold, Italic], Style["Stem", Bold, Italic], Style["Word", Bold, Italic], Style["Stem", Bold, Italic]} ], Spacings -> {2, 1}, Dividers -> {{1 -> True, 3 -> True, 5 -> True}, {1 -> True, 2 -> True, -1 -> True}} ]
Out[5]=

Exemplos Relacionados

de en es fr ja ko ru zh