Wolfram言語

テキストの大文字化

Capitalizeは,テキスト入力に利用可能な多数の大文字化スキームを含むようになった.

各スキームが異なるヒューリスティックを使って,指定された単語を大文字化すべきかどうかを決定する.

完全なWolfram言語入力を表示する

"TitleCase"大文字化はThe Chicago Manual of Styleを基準として使い,単語の位置と品詞を考慮する.

この大文字化スキームは広く使われているもので,多くの作品タイトルと一致する.例えば,このスキームは,「The Nancy Drew Mystery Stories」のような実際の書物のタイトルにおける大文字化と比較することができる.

ToLowerCaseを使ってすべての単語が小文字のベースラインから大文字化されたことを確認する.

次に,EditDistanceを使って,もとの作品タイトルと大文字化し直したものについて大文字化を比較する.両者で違いがある文字の数を示す整数が返される.

編集距離が0のものが170例,1のものが5例だった.

完全には一致しなかった書物のタイトルを選択し,Styleを使って両者の大文字化が異なる箇所をハイライトする.

この場合は,もとのタイトルで特定の短い単語が大文字になっており,"E-Mail"の大文字化も違うために,両者の大文字化には小さな違いがある.

例えば1990年から2000年までに出版された書物のように,大量の書物にも同じ考え方を使うことができる.

対数の縦軸を使ってすべての結果を見る.

ここでもまた大文字化は一致していることが多い.相違が最も大きい例を選択すると,独自の大文字化のため,あるいはもとのタイトルで特定の短い文字が慣習に従わない形で大文字化されたために違いが引き起こされたことが分かる.

関連する例

de en es fr ko pt-br zh