Wolfram Language

Traitement de texte et de langues

Générez et vérifiez des mots de base

La version 11 inclut de nouveaux outils pour trouver des mots de base, éliminer pluriels, flexions, etc. Le mot de base porte toujours le sens du mot original, mais souvent, il n'a pas la forme du mot qui apparaît dans le dictionnaire. Cet exemple montre des cas des deux situations.

Générez une liste de 30 mots anglais aléatoires à l'aide RandomWord.

In[1]:=
Click for copyable input
Short[words = RandomWord[30]]
Out[1]//Short=

Construisez leurs formes de base respectives avec WordStem.

In[2]:=
Click for copyable input
Short[wordstems = WordStem[words]]
Out[2]//Short=

Supprimez les mots qui sont identiques à leurs formes de base.

In[3]:=
Click for copyable input
list = DeleteCases[Transpose[{words, wordstems}], {w_, w_}];

Mettez en bleu les formes de bases qui sont aussi des mots dans le dictionnaire anglais utilisés par la nouvelle fonction DictionaryWordQ.

In[4]:=
Click for copyable input
list = Replace[ list, {w_, sw_?DictionaryWordQ} :> {w, Style[sw, Blue]}, {1}];

Visualisez chaque paire dans une grille de texte.

Montrer l'entrée complète de Wolfram Language
In[5]:=
Click for copyable input
TextGrid[ Prepend[ Partition[Flatten@list, UpTo[4]], {Style["Word", Bold, Italic], Style["Stem", Bold, Italic], Style["Word", Bold, Italic], Style["Stem", Bold, Italic]} ], Spacings -> {2, 1}, Dividers -> {{1 -> True, 3 -> True, 5 -> True}, {1 -> True, 2 -> True, -1 -> True}} ]
Out[5]=

Exemples connexes

de en es ja ko pt-br ru zh