テキスト中の文字
日本語には異なる3つの文字体系がある.
In[1]:=
Entity["Language", "Japanese"]["WritingScripts"]
Out[1]=
次は,ひらがなである.
In[2]:=
hiraganaCharacters =
Alphabet[Entity["WritingScript", "Hiragana::jx343"]]
Out[2]=
次の日本語テキストでひらがなをハイライトする.
In[3]:=
text = "汚れつちまつた悲しみに
今日も小雪の降りかかる
汚れつちまつた悲しみに
今日も風さへ吹きすぎる
汚れつちまつた悲しみは
たとへば狐の革裘
汚れつちまつた悲しみは
小雪のかかつてちぢこまる
汚れつちまつた悲しみは
なにのぞむなくねがふなく
汚れつちまつた悲しみは
倦怠のうちに死を夢む
汚れつちまつた悲しみに
いたいたしくも怖気づき
汚れつちまつた悲しみに
なすところもなく日は暮れ\[Ellipsis]\[Ellipsis]";
完全なWolfram言語入力を表示する
Out[4]=
WordCloudを使ってテキスト中のひらがなの相対的な頻度を示す.
In[5]:=
WordCloud[
StringCases[text,
x_ /; MatchQ[RemoveDiacritics[x],
Alternatives @@ hiraganaCharacters]]]
Out[5]=