Alle Unicode-Zeichen verwenden: Neu in Wolfram Language 12

Alle Unicode-Zeichen verwenden

Die Wolfram Language war eine der ersten Programmiersprachen, die den Unicode-Standard (www.unicode.org) angewendet hat. Version 12 erweitert die Palette der Zeichen, die von der Wolfram Language verarbeitet und geschrieben werden können, über die "Basic Multilingual Plane" der rund 50.000 gängigsten Zeichen hinaus auf die gesamte Bandbreite von mehr als einer Million möglicher Unicode-Zeichen. Die Wolfram Language ermöglicht außerdem die Konversion in und von UTF-8, die Übertragung über WSTP und bietet ein neues spezielles Eingabeformular für die Eingabe von 6-stelligen Hexadezimalcodes.

Geben Sie eine vierstellige Zeichenfolge mit den bereits vorhandenen hexadezimalen Eingaben\.xx für zweistellige Codes und \:yyyy für vierstellige Codes sowie das neue Formular \|zzzzzz für sechsstellige Codes ein.

Konvertieren Sie die Zeichen in Codepunkte. Das letzte Zeichen, mit einem Codepunkt über 65535, kann nun erstmals in der Wolfram Language dargestellt werden.

In Basis 16 wird die Übereinstimmung zwischen Eingabe und Codepunkten deutlich.

Konvertieren Sie die Zeichenkette in ByteArray unter Verwendung der UTF-8-Kodierung.

Die UTF-8-Kodierung ist eine Kodierung mit variabler Länge, bei der größere Codepunkte mehr Bytes erfordern. Teilen Sie das Byte-Array in vier Arrays mit zunehmender Länge auf.

Konvertieren Sie jedes Array wieder in eine Zeichenkette und zeigen Sie, dass jedes Array genau einem Zeichen entspricht.

Wolfram Language™

Alle Unicode-Zeichen verwenden

Verwandte Beispiele