Wolfram 语言

使用全部 Unicode 字符

Wolfram 语言是最早采用 Unicode 标准 (www.unicode.org) 的公司之一。版本 12 扩展了可由 Wolfram 语言处理和编写的字符范围,超越了 Basic Multilingual Plane 的大约 50000 个最常见的字符,扩展至全部一百多万个可能的 Unicode 字符。新版支持与 UTF-8 的互相转换,UTF-8 是一种新的特殊输入形式,用于输入 6-位的十六进制代码,并通过 WSTP 传输。

输入由四个字符组成的字符串,使用以前的十六进制输入形式 \.xx 输入 2-位的代码,用 \:yyyy 输入 4-位的代码,用新的形式 \|zzzzzz 输入 6-位的代码.

将字符转换为代码点。Wolfram 语言现可表示代码点大于 65535 的最后一位字符。

在基数为 16 的表示形式中,可清楚地看出输入形式和代码点之间的对应关系。

用 UTF-8 编码将字符串转换为 ByteArray

UTF-8 编码是一种可变长度编码,其中较大的代码点需要更多的字节。将字节数组拆分为四个字节长度增加的数组。

将每个数组转换回字符串,每个数组正好对应于一个字符。

相关范例

de en es fr ja ko pt-br