Язык Wolfram Language

Обработка текста и языка

Нахождение названий стран в текстах

Данный пример демонстрирует иное применение TextCases, в данном случае для того, чтобы распознать страны в заданном тексте.

Создайте список из трёх исторических периодов.

In[1]:=
Click for copyable input
periods = {Entity["HistoricalPeriod", "EuropeanRenaissance"], Entity["HistoricalPeriod", "AgeEnlightenment"], Entity["HistoricalPeriod", "IndustrialRevolution"]};

Извлеките соответствующие названия.

In[2]:=
Click for copyable input
names = CommonName[periods]
Out[2]=

Используйте WikipediaData для получения страницы с текстом для каждого исторического периода.

In[3]:=
Click for copyable input
wikipages = WikipediaData /@ names;

Используйте TextCases для получения названия стран, упомянутых на каждой странице, попутно удаляя дублированные упоминания.

In[4]:=
Click for copyable input
countries = DeleteDuplicates[TextCases[#, "Country" -> "Interpretation"]] & /@ wikipages;

Например, ниже представлены страны, присутствующие на странице о европейском Ренессансе.

In[5]:=
Click for copyable input
First[countries]
Out[5]=

Графически изобразите на соответствующих картах мира страны, упомянутые в каждой статье.

код на языке Wolfram Language целиком
In[6]:=
Click for copyable input
countries = DeleteCases[countries, Entity["Country", "World"], {2}]; Table[ GeoGraphics[{ EdgeForm[{Black}], Red, Polygon /@ countries[[i]] }, GeoRange -> "World", ImageSize -> 400, PlotLabel -> names[[i]], GeoBackground -> "Coastlines" ], {i, 3} ]
Out[6]=

Родственные примеры

de en es fr ja ko pt-br zh