Cree un corpus de Shakespeare con FileSystemScan
Para este ejemplo, un directorio es utilizado incluyendo archivos de texto de todas las obras de Shakespeare. Comience por importar el contenido textual de los libros con FileSystemMap, recolectando solamente el contenido textual.
muestre la entrada completa de Wolfram Language
In[2]:=
works = Values[
FileSystemMap[Import, FileNameJoin[{$HomeDirectory, "Books"}], 2,
FileNameForms -> "*.txt"][[1]]]
Out[2]=
Construya un único corpus usando StringJoin.
In[3]:=
corpus = StringJoin[works]
Out[3]=
El corpus ahora puede ser tratado como una sola cadena de caracteres de búsqueda, permitiendo el uso de aplicaciones avanzadas de procesamiento de texto de forma trivial. Determine de cuales países se hace referencia en estas obras usando TextCases, mientras filtra los duplicados y problemas de envoltura.
In[4]:=
countries =
ToLowerCase[TextCases[corpus, "Country"]] // DeleteDuplicates
Out[4]=
muestre la entrada completa de Wolfram Language
Construya un GeoListPlot de los países a los que se refiere en las obras de Shakespeare.
In[6]:=
GeoListPlot[Interpreter["Country"] /@ countries]
Out[6]=