Crie um corpus de Shakespeare com FileSystemScan
Para este exemplo, um diretório é utilizado incluindo arquivos de texto de todas as obras de Shakespeare. Comece importando o conteúdo textual dos livros com FileSystemMap, coletando apenas o conteúdo textual.
mostre o input completo da Wolfram Language
In[2]:=
works = Values[
FileSystemMap[Import, FileNameJoin[{$HomeDirectory, "Books"}], 2,
FileNameForms -> "*.txt"][[1]]]
Out[2]=
Construa apenas um corpus usando StringJoin.
In[3]:=
corpus = StringJoin[works]
Out[3]=
O corpus pode agora ser tratado como uma única cadeia de caracteres de busca, permitindo o uso de aplicações avançadas de processamento de texto. Determine quais países são citados nestas obras usando TextCases, enquanto filtra duplicações e diferenças entre maiúsculas e minúsculas.
In[4]:=
countries =
ToLowerCase[TextCases[corpus, "Country"]] // DeleteDuplicates
Out[4]=
mostre o input completo da Wolfram Language
Construa um GeoListPlot dos países citados nas obras de Shakespeare.
In[6]:=
GeoListPlot[Interpreter["Country"] /@ countries]
Out[6]=