Wolfram言語

テキストと言語の処理

語幹を調べる

バージョン11には,単語の語幹を求め,複数語尾や屈折語尾等を削除する新たなツールが含まれている.単語の語幹はもとの意味を有しているが,それ自体は辞書に含まれないことが多い.この例では,その両方の場合を示す.

RandomWordでランダムな英単語30個のリストを生成する.

In[1]:=
Click for copyable input
Short[words = RandomWord[30]]
Out[1]//Short=

WordStemで各単語の語幹を取り出す.

In[2]:=
Click for copyable input
Short[wordstems = WordStem[words]]
Out[2]//Short=

語幹と形が等しい単語を除く.

In[3]:=
Click for copyable input
list = DeleteCases[Transpose[{words, wordstems}], {w_, w_}];

語幹が新関数のDictionaryWordQで使われる英語の辞書に含まれる単語でもある場合には,それを青で強調する.

In[4]:=
Click for copyable input
list = Replace[ list, {w_, sw_?DictionaryWordQ} :> {w, Style[sw, Blue]}, {1}];

各ペアをテキストの表で可視化する.

完全なWolfram言語入力を表示する
In[5]:=
Click for copyable input
TextGrid[ Prepend[ Partition[Flatten@list, UpTo[4]], {Style["Word", Bold, Italic], Style["Stem", Bold, Italic], Style["Word", Bold, Italic], Style["Stem", Bold, Italic]} ], Spacings -> {2, 1}, Dividers -> {{1 -> True, 3 -> True, 5 -> True}, {1 -> True, 2 -> True, -1 -> True}} ]
Out[5]=

関連する例

de en es fr ko pt-br ru zh