Trabalhe com grandes banco de dados
Este exemplo examina um banco de dados em escala de terabytes e executa algumas consultas básicas que seriam impossíveis de executar na memória.
Open Street Map é um projeto colaborativo para gerar um mapa do mundo gratuitamente. Desde o lançamento do projeto em 2004, mais de dois milhões de usuários geraram mais de um terabyte de dados. Por isso, é um excelente exemplo de banco de dados para mostrar ciência de dados fora do núcleo. Instruções sobre como obter os dados e configurar um servidor de banco de dados podem ser encontradas aqui.
Registre o banco de dados para uso com entidades.
Este é um banco de dados muito grande; sua maior tabela "planet_osm_nodes" ocupa quase 200 GB no disco. Esse é o número de linhas na tabela.
Suponha que você queira encontrar todas as ruas que contenham "Wolf".
Infelizmente, os resultados contêm algumas ruas duplicadas, mas você pode verificar o número de nomes diferentes.
Outra coisa interessante é o "planet_osm_table", que contém muitos metadados sobre vários objetos. Por exemplo, você pode verificar quantas árvores foram mapeadas.
Ou quais são as estruturas esportivas mais comuns.
Visualize o resultado.