Wolfram Language

Text- und Sprachverarbeitung

Häufigkeit von Nomen in Reden

Extrahieren Sie mit TextCases Teilstrings einer bestimmten Wortart, z.B. Nomen oder Verben, aber auch Länder, E-Mailadressen etc.

Erstellen Sie einen Datensatz aller Reden, die je von US-Präsidenten vor dem US-Kongress gehalten wurden.

In[1]:=
Click for copyable input
data = ResourceData["State of the Union Addresses"];

Reduzieren Sie die Größe des Datensatzes, indem Sie nur die Namen der Präsidenten, Jahreszahlen der Reden und Text der Reden berücksichtigen.

In[2]:=
Click for copyable input
reduceddata = data[All, {"President", "Year", "Text"}];

Beschränken Sie sich auf Reden in 10-Jahres-Intervallen.

In[3]:=
Click for copyable input
years = Range[1965, 2015, 10]; speeches = Select[reduceddata, MemberQ[years, #Year] &]
Out[3]=

Identifizieren Sie mit TextCases die Nomen in jeder Rede.

In[4]:=
Click for copyable input
nouns = TextCases[Normal@speeches[All, "Text"], "Noun"];

Zählen Sie, wie oft die unterschiedlichen Nomen pro Rede vorkommen.

In[5]:=
Click for copyable input
freqnouns = Counts /@ nouns;

Ignorieren Sie Wörter, die in den meisten Reden sehr oft vorkommen.

In[6]:=
Click for copyable input
freqnouns = KeyDrop[freqnouns, {"country", "people", "year", "years", "world"}];

Generieren Sie Schlagwortwolken zur Veranschaulichung der Häufigkeit bestimmter Nomen im Lauf der Zeit.

Den kompletten Wolfram Language-Input zeigen
In[7]:=
Click for copyable input
labels = Normal@ speeches[All, CommonName[#President] <> " " <> ToString[#Year] &]; WordCloud[freqnouns[[#]], PlotLabel -> labels[[#]]] & /@ Range[6]
Out[7]=

Verwandte Beispiele

en es fr ja ko pt-br ru zh