Wolfram Language

Text- und Sprachverarbeitung

Berechnungen mit mehrsprachigen Wortlisten

Vergleichen Sie die Verteilung der Anzahl von Zeichen pro Wort in unterschiedlichen Sprachen.

In[1]:=
Click for copyable input
languages = {"German", "English", "Italian", "Dutch", "Russian"};

Ermitteln Sie die Liste verfügbarer Wörter für diese Sprachen und fassen Sie diese in einer Assoziation zusammen.

In[2]:=
Click for copyable input
words = Association[# -> WordList[Language -> #] & /@ languages];

Berechnen Sie die Länge jedes dieser Wörter.

In[3]:=
Click for copyable input
wordLengths = StringLength /@ words;

Dies sind die Mindest- und Maximallängen:

In[4]:=
Click for copyable input
MinMax /@ wordLengths
Out[4]=

Visualisieren Sie überlappende Histogramme relativer Häufigkeiten in jeder Sprache. Russisch und Englisch haben einen höheren Anteil kürzerer Wörter, während Niederländisch und Deutsch deutlich längere Wörter verzeichnen.

In[5]:=
Click for copyable input
Histogram[wordLengths, Automatic, "PDF", ChartLegends -> Automatic]
Out[5]=

Kombinieren Sie Histogramme, um die absolute Wortlänge aller Sprachen zu visualisieren.

In[6]:=
Click for copyable input
Histogram[wordLengths, ChartLegends -> Automatic, ChartLayout -> "Stacked"]
Out[6]=

Verwandte Beispiele

en es fr ja ko pt-br ru zh