Examinez les caractéristiques de langues, d'alphabets et de systèmes d'écriture
La version 11 permet d'accéder à une connaissance intégrée approfondie sur les langues, les systèmes d'écriture et les alphabets.
Différentes langues peuvent partager le même système d'écriture mais utiliser différents caractères. Cet exemple explore la grande variabilité du nombre de caractères dans les langues en utilisant le système d'écriture latin.
Prenez la liste des alphabets qui utilisent le système d'écriture latin.

alphabets =
EntityList[
EntityClass["Alphabet",
"WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];

Length[alphabets]

Il y a 131 alphabets de ce type. Affichez-en un petit échantillon.

RandomSample[alphabets, 15]

Construisez une association qui stocke la liste des caractères de chaque alphabet.

letters =
EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];
L'alphabet le plus court est le mohawk, avec 12 lettres.

letters[Entity["Alphabet", "Mohawk::p8wq4"]]

Lalphabet le plus long est le slovaque, avec 46 caractères.

letters[Entity["Alphabet", "Slovak::kj62d"]]

Cet histogramme montre que la longueur la plus courante est de 26 lettres, comme l'anglais, bien que tous les alphabets de 26 lettres ne contiennent pas les mêmes lettres.

Histogram[Length /@ letters, 30]

Maintenant, comptez le nombre d'alphabets dans lequel une lettre donnée est présente. Seules trois lettres sont présentes dans les 131 alphabets latins, à savoir a, i et n.

TakeLargest[Counts[Flatten[Values[letters]]], 10]

Le mohawk ne contient pas la lettre m, et l'alphabet hawaïen est le seul à ne pas avoir de t.

letters[Entity["Alphabet", "Hawaiian::p38r5"]]
