Wolfram Language

Traitement de texte et de langues

Générez et vérifiez la racine des mots

La version 11 comprend de nouveaux outils permettant de trouver les racines des mots, en supprimant les pluriels, les flexions, etc. La racine du mot conserve le sens du mot original, mais il arrive souvent qu'elle ne soit pas elle-même un mot du dictionnaire. Cet exemple montre des exemples des deux situations.

Générez une liste de 30 mots anglais de façon aléatoire à l'aide de RandomWord.

In[1]:=
Click for copyable input
Short[words = RandomWord[30]]
Out[1]//Short=

Créez leurs racines respectives à l'aide de WordStem.

In[2]:=
Click for copyable input
Short[wordstems = WordStem[words]]
Out[2]//Short=

Supprimez les mots qui ont une racine identique.

In[3]:=
Click for copyable input
list = DeleteCases[Transpose[{words, wordstems}], {w_, w_}];

Mettez en bleu les racines qui sont également des mots du dictionnaire anglais utilisé par la nouvelle fonction DictionaryWordQ.

In[4]:=
Click for copyable input
list = Replace[ list, {w_, sw_?DictionaryWordQ} :> {w, Style[sw, Blue]}, {1}];

Visualisez chaque paire dans une grille de texte.

Afficher l'entrée complète de Wolfram Language
In[5]:=
Click for copyable input
TextGrid[ Prepend[ Partition[Flatten@list, UpTo[4]], {Style["Word", Bold, Italic], Style["Stem", Bold, Italic], Style["Word", Bold, Italic], Style["Stem", Bold, Italic]} ], Spacings -> {2, 1}, Dividers -> {{1 -> True, 3 -> True, 5 -> True}, {1 -> True, 2 -> True, -1 -> True}} ]
Out[5]=

Exemples connexes

de en es ja ko pt-br ru zh