Wolfram Language

Expansion de la base de connaissance

Examinez les caractéristiques de langues, d'alphabets et de systèmes d'écriture

La version 11 permet d'accéder à une connaissance approfondie intégrée sur les langues, système d'écriture, et alphabets.

Différentes langues peuvent partager le même script d'écriture (ou système d'écriture), mais utilisent différents caractères. Cet exemple explore la grande variabilité du nombre de caractères dans les langues en utilisant le système d'écriture latin.

Prenez la liste des alphabets qui utilisent le système d'écriture latin.

In[1]:=
Click for copyable input
alphabets = EntityList[ EntityClass["Alphabet", "WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
In[2]:=
Click for copyable input
Length[alphabets]
Out[2]=

Il y a 131 alphabets de ce type. Afficher un petit échantillon d'entre eux.

In[3]:=
Click for copyable input
RandomSample[alphabets, 15]
Out[3]=

Construisez une association qui stocke la liste des caractères de chaque alphabet.

In[4]:=
Click for copyable input
letters = EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];

Le plus court alphabet est Mohawk, avec 12 lettres.

In[5]:=
Click for copyable input
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
Out[5]=

Le plus long alphabet est le slovaque, avec 46 caractères.

In[6]:=
Click for copyable input
letters[Entity["Alphabet", "Slovak::kj62d"]]
Out[6]=

Cet histogramme montre que la longueur la plus courante est de 26 lettres, comme l'anglais, mais pas tous les alphabets 26 lettres contiennent les mêmes lettres.

In[7]:=
Click for copyable input
Histogram[Length /@ letters, 30]
Out[7]=

Maintenant, comptez le nombre de alphabets dans lequel une lettre donnée est présente. Seules trois lettres sont présentes dans les 131 alphabets latins, à savoir a, i, n.

In[8]:=
Click for copyable input
TakeLargest[Counts[Flatten[Values[letters]]], 10]
Out[8]=

Mohawk ne contient pas la lettre m, et l'alphabet hawaïen est le seul à ne pas avoir t.

In[9]:=
Click for copyable input
letters[Entity["Alphabet", "Hawaiian::p38r5"]]
Out[9]=

Exemples connexes

de en es ja ko pt-br ru zh