Examinez les caractéristiques de langues, d'alphabets et de systèmes d'écriture
La version 11 permet d'accéder à une connaissance approfondie intégrée sur les langues, système d'écriture, et alphabets.
Différentes langues peuvent partager le même script d'écriture (ou système d'écriture), mais utilisent différents caractères. Cet exemple explore la grande variabilité du nombre de caractères dans les langues en utilisant le système d'écriture latin.
Prenez la liste des alphabets qui utilisent le système d'écriture latin.

alphabets =
EntityList[
EntityClass["Alphabet",
"WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];

Length[alphabets]

Il y a 131 alphabets de ce type. Afficher un petit échantillon d'entre eux.

RandomSample[alphabets, 15]

Construisez une association qui stocke la liste des caractères de chaque alphabet.

letters =
EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];
Le plus court alphabet est Mohawk, avec 12 lettres.

letters[Entity["Alphabet", "Mohawk::p8wq4"]]

Le plus long alphabet est le slovaque, avec 46 caractères.

letters[Entity["Alphabet", "Slovak::kj62d"]]

Cet histogramme montre que la longueur la plus courante est de 26 lettres, comme l'anglais, mais pas tous les alphabets 26 lettres contiennent les mêmes lettres.

Histogram[Length /@ letters, 30]

Maintenant, comptez le nombre de alphabets dans lequel une lettre donnée est présente. Seules trois lettres sont présentes dans les 131 alphabets latins, à savoir a, i, n.

TakeLargest[Counts[Flatten[Values[letters]]], 10]

Mohawk ne contient pas la lettre m, et l'alphabet hawaïen est le seul à ne pas avoir t.

letters[Entity["Alphabet", "Hawaiian::p38r5"]]
