Wolfram Language

Text- und Sprachverarbeitung

Wortstämme generieren und überprüfen

Version 11 bietet neue Tools zum Erkennen von Wortstämmen, zum Entfernen von Pluralmarkierungen und Flexionen etc. Wortstämme vermitteln immer noch die Bedeutung des ursprünglichen Worts, aber oft findet man dazu keinen eigenen Wörterbucheintrag. Dieses Beispiel veranschaulicht beide Fälle.

Generieren Sie mit RandomWord eine Liste aus 30 zufälligen englischen Wörtern.

In[1]:=
Click for copyable input
Short[words = RandomWord[30]]
Out[1]//Short=

Erzeugen Sie mit WordStem die jeweiligen Stammformen.

In[2]:=
Click for copyable input
Short[wordstems = WordStem[words]]
Out[2]//Short=

Entfernen Sie jene Wörter, die identisch mit ihrer Stammform sind.

In[3]:=
Click for copyable input
list = DeleteCases[Transpose[{words, wordstems}], {w_, w_}];

Markieren Sie mit der neuen Funktion DictionaryWordQ jene Stammformen, die gleichzeitig auch Wörter mit Wörterbucheintrag sind, in blau.

In[4]:=
Click for copyable input
list = Replace[ list, {w_, sw_?DictionaryWordQ} :> {w, Style[sw, Blue]}, {1}];

Visualisieren Sie jedes Paar in einer Tabelle.

Den kompletten Wolfram Language-Input zeigen
In[5]:=
Click for copyable input
TextGrid[ Prepend[ Partition[Flatten@list, UpTo[4]], {Style["Word", Bold, Italic], Style["Stem", Bold, Italic], Style["Word", Bold, Italic], Style["Stem", Bold, Italic]} ], Spacings -> {2, 1}, Dividers -> {{1 -> True, 3 -> True, 5 -> True}, {1 -> True, 2 -> True, -1 -> True}} ]
Out[5]=

Verwandte Beispiele

en es fr ja ko pt-br ru zh