Wolfram Language

Expansão da base de conhecimento

Examine as características de idiomas, alfabetos, e sistemas de escrita

A versão 11 disponibiliza acesso ao amplo conhecimento integrado de idiomas, sistemas de escrita, e alfabetos.

Idiomas diferentes podem compartilhar o mesmo sistema de escrita, mas usam alfabetos com diferentes caracteres. Este exemplo explora a grande variabilidade no número de caracteres nos idiomas usando o sistema de escrita latino.

Pegue a lista de alfabetos que utilizam o sistema de escrita latino.

In[1]:=
Click for copyable input
alphabets = EntityList[ EntityClass["Alphabet", "WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
In[2]:=
Click for copyable input
Length[alphabets]
Out[2]=

Existem 131 alfabetos desse tipo. Mostre uma pequena amostra deles.

In[3]:=
Click for copyable input
RandomSample[alphabets, 15]
Out[3]=

Construia uma associação armazenando a lista de caracteres de cada alfabeto.

In[4]:=
Click for copyable input
letters = EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];

O alfabeto mais curto é o Mohawk, com 12 letras.

In[5]:=
Click for copyable input
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
Out[5]=

O alfabeto mais longo é o eslovaco, com 46 caracteres.

In[6]:=
Click for copyable input
letters[Entity["Alphabet", "Slovak::kj62d"]]
Out[6]=

Este histograma mostra que a quantidade mais comum é de 26 letras, como o inglês, embora nem todos oscalfabetos de 26 letras contêm as mesmas letras.

In[7]:=
Click for copyable input
Histogram[Length /@ letters, 30]
Out[7]=

Agora, conte o número de alfabetos em que uma determinada letra está presente. Apenas três letras estão presentes em todos os 131 alfabetos latinos: a, i, n.

In[8]:=
Click for copyable input
TakeLargest[Counts[Flatten[Values[letters]]], 10]
Out[8]=

Mohawk não contém a letra m, e o alfabeto havaiano é o único que não possui t.

In[9]:=
Click for copyable input
letters[Entity["Alphabet", "Hawaiian::p38r5"]]
Out[9]=

Exemplos Relacionados

de en es fr ja ko ru zh