Wolfram Language

Ausbau der Knowledgebase

Charakteristika von Sprachen, Alphabeten und Schriften untersuchen

In Version 11 kann umfassendes eingebautes Wissen über Sprachen, Schriften und Alphabete abgerufen werden.

Unterschiedliche Sprachen können dasselbe Schriftsystem haben, jedoch ein anderes Alphabet verwenden. Dieses Beispiel untersucht die Unterschiede in der Buchstabenanzahl in Sprachen, die die lateinische Schrift verwenden.

Rufen Sie eine Liste von Alphabeten ab, die die lateinische Schrift benutzen.

In[1]:=
Click for copyable input
alphabets = EntityList[ EntityClass["Alphabet", "WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
In[2]:=
Click for copyable input
Length[alphabets]
Out[2]=

Es gibt 131 solcher Alphabete. Führen Sie einige Beispiele davon an.

In[3]:=
Click for copyable input
RandomSample[alphabets, 15]
Out[3]=

Bilden Sie eine Assoziation, die die Buchstaben jedes Alphabeths speichert.

In[4]:=
Click for copyable input
letters = EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];

Die Sprache Mohawk hat mit 12 Buchstaben das kürzeste Alphabet.

In[5]:=
Click for copyable input
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
Out[5]=

Slowakisch ist die Sprache mit dem längsten Alphabet, mit 46 Buchstaben.

In[6]:=
Click for copyable input
letters[Entity["Alphabet", "Slovak::kj62d"]]
Out[6]=

Dieses Histogramm zeigt, dass die meisten Alphabete 26 Buchstaben haben, so wie Englisch und Deutsch, obwohl nicht alle Alphabete mit 26 Buchtsaben dieselben Buchstaben enthalten.

In[7]:=
Click for copyable input
Histogram[Length /@ letters, 30]
Out[7]=

Zählen Sie nun die Anzahl der Alphabethe, in denen ein bestimmter Buchstabe vorkommt. Nur drei Buchstaben sind in allen 131 Alphabeten lateinischer Schrift enthalten, nämlich a, i und n.

In[8]:=
Click for copyable input
TakeLargest[Counts[Flatten[Values[letters]]], 10]
Out[8]=

Mohawk kennt den Buchstaben m nicht, und das Hawaiianische Alphabet enthält als einziges kein t.

In[9]:=
Click for copyable input
letters[Entity["Alphabet", "Hawaiian::p38r5"]]
Out[9]=

Verwandte Beispiele

en es fr ja ko pt-br ru zh