Trabaje con una gran base de datos
Este ejemplo ve una base de datos de escala terabyte y realiza algunas consultas básicas que serían imposibles de realizar dentro de la memoria.
Open Street Map es un esfuerzo colaborativo para generar un mapa gratuito del mundo. El proyecto de base de datos fue creado en el 2004 y sus más de dos millones de usuarios han generado más de un terabyte de datos. Por lo tanto, es un gran ejemplo para mostrar ciencia de datos fuera del núcleo. Las instrucciones de cómo obtener los datos y configurar un servidor de base de datos pueden ser encontrados aquí.
Registre la base de datos para ser usada con entidades.
Esta es una base de datos muy grande; su tabla más grande "planet_osm_nodes" toma casi 200 GB del disco. Aquí se muestra cuántas filas contiene.
Suponga que deseaba encontrar todas las calles que contenga "Wolf".
Desafortunadamente estos contienen varios duplicados, pero usted puede verificar el número de distintos nombres.
Otro factor interesante de la tabla "planet_osm_table" es que contiene muchos metadatos acerca de varios objetos. Por ejemplo, usted puede revisar cuántos árboles fueron mapeados.
O cuáles son las estructuras deportivas más comunes.
Visualice el resultado.