Examine as características de idiomas, alfabetos, e sistemas de escrita
A versão 11 disponibiliza acesso ao amplo conhecimento integrado de idiomas, sistemas de escrita, e alfabetos.
Idiomas diferentes podem compartilhar o mesmo sistema de escrita, mas usam alfabetos com diferentes caracteres. Este exemplo explora a grande variabilidade no número de caracteres nos idiomas usando o sistema de escrita latino.
Pegue a lista de alfabetos que utilizam o sistema de escrita latino.
alphabets =
EntityList[
EntityClass["Alphabet",
"WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
Length[alphabets]
Existem 131 alfabetos desse tipo. Mostre uma pequena amostra deles.
RandomSample[alphabets, 15]
Construia uma associação armazenando a lista de caracteres de cada alfabeto.
letters =
EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];
O alfabeto mais curto é o Mohawk, com 12 letras.
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
O alfabeto mais longo é o eslovaco, com 46 caracteres.
letters[Entity["Alphabet", "Slovak::kj62d"]]
Este histograma mostra que a quantidade mais comum é de 26 letras, como o inglês, embora nem todos oscalfabetos de 26 letras contêm as mesmas letras.
Histogram[Length /@ letters, 30]
Agora, conte o número de alfabetos em que uma determinada letra está presente. Apenas três letras estão presentes em todos os 131 alfabetos latinos: a, i, n.
TakeLargest[Counts[Flatten[Values[letters]]], 10]
Mohawk não contém a letra m, e o alfabeto havaiano é o único que não possui t.
letters[Entity["Alphabet", "Hawaiian::p38r5"]]