Wolfram Language

Expansión de la base de conocimiento

Examine las características de lenguajes, alfabetos y sistemas de escritura

La versión 11 proporciona acceso a extenso conocimiento incorporado acerca de lenguajes, sistemas de escritura y alfabetos.

Es posible que distintos lenguajes compartan la misma escritura o sistema de escritura, pero todavía utilizar diferentes caracteres. Este ejemplo explora la gran variabilidad en el número de caracteres de los lenguajes que utilizan el sistema de escritura latino.

Tome una lista de alfabetos que utilizan el sistema de escritura latino.

In[1]:=
Click for copyable input
alphabets = EntityList[ EntityClass["Alphabet", "WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
In[2]:=
Click for copyable input
Length[alphabets]
Out[2]=

Existen 131 alfabetos de ese tipo. Vea una pequeña muestra de ellos.

In[3]:=
Click for copyable input
RandomSample[alphabets, 15]
Out[3]=

Construya una asociación que almacene la lista de caracteres de cada alfabeto.

In[4]:=
Click for copyable input
letters = EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];

El alfabeto más corto es Mohawk, con 12 letras.

In[5]:=
Click for copyable input
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
Out[5]=

El alfabeto más largo es el eslovaco, con 46 caracteres.

In[6]:=
Click for copyable input
letters[Entity["Alphabet", "Slovak::kj62d"]]
Out[6]=

Este histograma muestra que la longitud más común es de 26 letras, como en inglés, no todos los alfabetos de 26 letras contienen las mismas letras.

In[7]:=
Click for copyable input
Histogram[Length /@ letters, 30]
Out[7]=

Ahora cuente el número de alfabetos en donde una letra dada está presente. Solo tres letras están presentes en los 131 alfabetos latinos: a, i, n.

In[8]:=
Click for copyable input
TakeLargest[Counts[Flatten[Values[letters]]], 10]
Out[8]=

Mohawk no contiene la letra m y el alfabeto hawaiano es el único que no contiene t.

In[9]:=
Click for copyable input
letters[Entity["Alphabet", "Hawaiian::p38r5"]]
Out[9]=

Ejemplos relacionados

de en fr ja ko pt-br ru zh