Wolfram 언어

텍스트와 언어 처리

어간 생성 및 증명

버전 11은 단어의 어간을 찾고, 복수형, 어형 변화 등을 제거하는 새로운 도구를 포함하고 있습니다. 단어의 어간은 그 본래의 의미를 가지고 있지만, 그 자체가 사전에 포함되어 있지 않은 경우를 흔히 볼 수 있습니다. 이 예에서는 그 두 경우를 살펴봅니다.

RandomWord를 사용하여 임의의 영어 단어 30개의 목록을 생성합니다.

In[1]:=
Click for copyable input
Short[words = RandomWord[30]]
Out[1]//Short=

WordStem을 사용하여 각 단어의 어간을 구축합니다.

In[2]:=
Click for copyable input
Short[wordstems = WordStem[words]]
Out[2]//Short=

어간과 형태가 동일한 단어를 삭제합니다.

In[3]:=
Click for copyable input
list = DeleteCases[Transpose[{words, wordstems}], {w_, w_}];

새로운 함수 DictionaryWordQ에서 사용되고 영어 사전에 있는 단어이기도 한 어간을 파란색으로 강조합니다.

In[4]:=
Click for copyable input
list = Replace[ list, {w_, sw_?DictionaryWordQ} :> {w, Style[sw, Blue]}, {1}];

각 쌍을 텍스트 그리드로 시각화합니다.

전체 Wolfram 언어 입력 표시하기
In[5]:=
Click for copyable input
TextGrid[ Prepend[ Partition[Flatten@list, UpTo[4]], {Style["Word", Bold, Italic], Style["Stem", Bold, Italic], Style["Word", Bold, Italic], Style["Stem", Bold, Italic]} ], Spacings -> {2, 1}, Dividers -> {{1 -> True, 3 -> True, 5 -> True}, {1 -> True, 2 -> True, -1 -> True}} ]
Out[5]=

관련 예제

de en es fr ja pt-br ru zh