Charakteristika von Sprachen, Alphabeten und Schriften untersuchen
In Version 11 kann umfassendes eingebautes Wissen über Sprachen, Schriften und Alphabete abgerufen werden.
Unterschiedliche Sprachen können dasselbe Schriftsystem haben, jedoch ein anderes Alphabet verwenden. Dieses Beispiel untersucht die Unterschiede in der Buchstabenanzahl in Sprachen, die die lateinische Schrift verwenden.
Rufen Sie eine Liste von Alphabeten ab, die die lateinische Schrift benutzen.
alphabets =
EntityList[
EntityClass["Alphabet",
"WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
Length[alphabets]
Es gibt 131 solcher Alphabete. Führen Sie einige Beispiele davon an.
RandomSample[alphabets, 15]
Bilden Sie eine Assoziation, die die Buchstaben jedes Alphabeths speichert.
letters =
EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];
Die Sprache Mohawk hat mit 12 Buchstaben das kürzeste Alphabet.
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
Slowakisch ist die Sprache mit dem längsten Alphabet, mit 46 Buchstaben.
letters[Entity["Alphabet", "Slovak::kj62d"]]
Dieses Histogramm zeigt, dass die meisten Alphabete 26 Buchstaben haben, so wie Englisch und Deutsch, obwohl nicht alle Alphabete mit 26 Buchtsaben dieselben Buchstaben enthalten.
Histogram[Length /@ letters, 30]
Zählen Sie nun die Anzahl der Alphabethe, in denen ein bestimmter Buchstabe vorkommt. Nur drei Buchstaben sind in allen 131 Alphabeten lateinischer Schrift enthalten, nämlich a, i und n.
TakeLargest[Counts[Flatten[Values[letters]]], 10]
Mohawk kennt den Buchstaben m nicht, und das Hawaiianische Alphabet enthält als einziges kein t.
letters[Entity["Alphabet", "Hawaiian::p38r5"]]