Wolfram 语言

文本和语言处理

找出文本中的国家实体

该范例显示了 TextCases 的另一种用法,用其识别给定文本中的国家.

构建三个历史时期的列表.

In[1]:=
Click for copyable input
periods = {Entity["HistoricalPeriod", "EuropeanRenaissance"], Entity["HistoricalPeriod", "AgeEnlightenment"], Entity["HistoricalPeriod", "IndustrialRevolution"]};

提取其相对应名称.

In[2]:=
Click for copyable input
names = CommonName[periods]
Out[2]=

WikipediaData 提取每个历史时期页面的文本.

In[3]:=
Click for copyable input
wikipages = WikipediaData /@ names;

TextCases 提取这些页面中提到的国家,并删除重复.

In[4]:=
Click for copyable input
countries = DeleteDuplicates[TextCases[#, "Country" -> "Interpretation"]] & /@ wikipages;

例如,以下为在欧洲文艺复兴时期页面中找到的国家.

In[5]:=
Click for copyable input
First[countries]
Out[5]=

将每个文章中提到的国家分别绘制在世界地图上.

显示完整的 Wolfram 语言输入
In[6]:=
Click for copyable input
countries = DeleteCases[countries, Entity["Country", "World"], {2}]; Table[ GeoGraphics[{ EdgeForm[{Black}], Red, Polygon /@ countries[[i]] }, GeoRange -> "World", ImageSize -> 400, PlotLabel -> names[[i]], GeoBackground -> "Coastlines" ], {i, 3} ]
Out[6]=

相关范例

de en es fr ja ko pt-br ru