使用全部 Unicode 字符: Wolfram 语言 12 的新功能

使用全部 Unicode 字符

Wolfram 语言是最早采用 Unicode 标准 (www.unicode.org) 的公司之一。版本 12 扩展了可由 Wolfram 语言处理和编写的字符范围，超越了 Basic Multilingual Plane 的大约 50000 个最常见的字符，扩展至全部一百多万个可能的 Unicode 字符。新版支持与 UTF-8 的互相转换，UTF-8 是一种新的特殊输入形式，用于输入 6-位的十六进制代码，并通过 WSTP 传输。

输入由四个字符组成的字符串，使用以前的十六进制输入形式 \.xx 输入 2-位的代码，用 \:yyyy 输入 4-位的代码，用新的形式 \|zzzzzz 输入 6-位的代码.

将字符转换为代码点。Wolfram 语言现可表示代码点大于 65535 的最后一位字符。

在基数为 16 的表示形式中，可清楚地看出输入形式和代码点之间的对应关系。

用 UTF-8 编码将字符串转换为 ByteArray。

UTF-8 编码是一种可变长度编码，其中较大的代码点需要更多的字节。将字节数组拆分为四个字节长度增加的数组。

将每个数组转换回字符串，每个数组正好对应于一个字符。

Wolfram 语言™

使用全部 Unicode 字符

相关范例