Wolfram言語

すべてのUnicode文字を使う

Wolfram言語は,Unicode標準 (www.unicode.org) をいち早く適用した言語の一つである.バージョン12では,Wolfram言語で処理したり書いたりすることができる文字の範囲が,約5万個の最もよく使われる文字である基本多言語面(Basic Multilingual Plane)から100万個を超える可能なUnicodeの全文字に拡張された.UTF-8から変換,UTF-8への変換,6桁の16進コードを入力する新しい特別入力形式,WSTP上での送信がサポートされている.

既存の16進入力形式.xxを2桁コードに,:yyyyを4桁コードに使うだけでなく,新形式|zzzzzzを6桁コードに使い,4文字の文字列を入力する.

文字をコード点に変換する.最後の文字は65535より上のコード点を持ち,Wolfram言語で新たに表現できるようになった.

基数16では,入力形式とコード点との関係は明らかである.

UTF-8エンコーディングを使って,文字列をByteArrayに変換する.

UTF-8エンコーディングは,より大きいコード点がより多くのバイトを必要とする可変長エンコーディングである.バイト配列を長さが増えていく4つの配列に分割する.

それぞれの配列を文字列に変換し直し,それぞれの配列が厳密に1つの文字に対応することを示す.

関連する例

de en es fr ko pt-br zh