Wolfram Language

Élargissement de la base de connaissances

Examinez les caractéristiques de langues, d'alphabets et de systèmes d'écriture

La version 11 permet d'accéder à une connaissance intégrée approfondie sur les langues, les systèmes d'écriture et les alphabets.

Différentes langues peuvent partager le même système d'écriture mais utiliser différents caractères. Cet exemple explore la grande variabilité du nombre de caractères dans les langues en utilisant le système d'écriture latin.

Prenez la liste des alphabets qui utilisent le système d'écriture latin.

In[1]:=
Click for copyable input
alphabets = EntityList[ EntityClass["Alphabet", "WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
In[2]:=
Click for copyable input
Length[alphabets]
Out[2]=

Il y a 131 alphabets de ce type. Affichez-en un petit échantillon.

In[3]:=
Click for copyable input
RandomSample[alphabets, 15]
Out[3]=

Construisez une association qui stocke la liste des caractères de chaque alphabet.

In[4]:=
Click for copyable input
letters = EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];

L'alphabet le plus court est le mohawk, avec 12 lettres.

In[5]:=
Click for copyable input
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
Out[5]=

Lalphabet le plus long est le slovaque, avec 46 caractères.

In[6]:=
Click for copyable input
letters[Entity["Alphabet", "Slovak::kj62d"]]
Out[6]=

Cet histogramme montre que la longueur la plus courante est de 26 lettres, comme l'anglais, bien que tous les alphabets de 26 lettres ne contiennent pas les mêmes lettres.

In[7]:=
Click for copyable input
Histogram[Length /@ letters, 30]
Out[7]=

Maintenant, comptez le nombre d'alphabets dans lequel une lettre donnée est présente. Seules trois lettres sont présentes dans les 131 alphabets latins, à savoir a, i et n.

In[8]:=
Click for copyable input
TakeLargest[Counts[Flatten[Values[letters]]], 10]
Out[8]=

Le mohawk ne contient pas la lettre m, et l'alphabet hawaïen est le seul à ne pas avoir de t.

In[9]:=
Click for copyable input
letters[Entity["Alphabet", "Hawaiian::p38r5"]]
Out[9]=

Exemples connexes

de en es ja ko pt-br ru zh