Examine las características de lenguajes, alfabetos y sistemas de escritura
La versión 11 proporciona acceso a extenso conocimiento incorporado acerca de lenguajes, sistemas de escritura y alfabetos.
Es posible que distintos lenguajes compartan la misma escritura o sistema de escritura, pero todavía utilizar diferentes caracteres. Este ejemplo explora la gran variabilidad en el número de caracteres de los lenguajes que utilizan el sistema de escritura latino.
Tome una lista de alfabetos que utilizan el sistema de escritura latino.

alphabets =
EntityList[
EntityClass["Alphabet",
"WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];

Length[alphabets]

Existen 131 alfabetos de ese tipo. Vea una pequeña muestra de ellos.

RandomSample[alphabets, 15]

Construya una asociación que almacene la lista de caracteres de cada alfabeto.

letters =
EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];
El alfabeto más corto es Mohawk, con 12 letras.

letters[Entity["Alphabet", "Mohawk::p8wq4"]]

El alfabeto más largo es el eslovaco, con 46 caracteres.

letters[Entity["Alphabet", "Slovak::kj62d"]]

Este histograma muestra que la longitud más común es de 26 letras, como en inglés, no todos los alfabetos de 26 letras contienen las mismas letras.

Histogram[Length /@ letters, 30]

Ahora cuente el número de alfabetos en donde una letra dada está presente. Solo tres letras están presentes en los 131 alfabetos latinos: a, i, n.

TakeLargest[Counts[Flatten[Values[letters]]], 10]

Mohawk no contiene la letra m y el alfabeto hawaiano es el único que no contiene t.

letters[Entity["Alphabet", "Hawaiian::p38r5"]]
