使用大型数据库
此范例查看 TB 级数据库并执行一些无法在内存中执行的基本查询。
Open Street Map 是一项协同努力,以生成一个免费的世界地图。该项目于 2004 年创建,其超过 200 万用户已经生成了超过 1TB 的数据。因此,它是一个很好的范例数据库,用于展示核外数据科学。有关如何获取数据和设置数据库服务器的说明,请参见此处。
注册数据库以供实体使用。
这是一个非常大的数据库; 其最大的表 "planet_osm_nodes" 在磁盘上占用近 200 GB。这是它包含的行数。
假设你想找到所有包含 "Wolf" 的街道。
不幸的是,它们包含了不少重复项,但您可以检查不同名称的数量。
另一个有趣的事情是 "planet_osm_table",它包含许多关于各种对象的元数据。例如,您可以检查映射了多少树。
或者最常见的运动结构是什么。
可视化结果。