连接到公共 MySQL 实例
在生物信息学中,有许多公共 SQL 端点包含非常大的数据集。此范例显示连接到一个并快速提取在内存中很难处理的信息是多么容易。
要查看某些数据,您必须连接到 ensembl project 提供的公共端点,并提取两个表的架构信息。
构建一个 EntityStore。
然后注册。
由于您将计算卸载到外部数据库,所以一切都非常快。
表中有超过 250 万行,您可以在几分之一秒内计算它们(包括网络往返)。
一个有趣的问题是,基因最常见的生物型是什么? 首先,你要按生物型分组并计算基因。
然后按 "count" 属性排序,只取 10 个最大值。
请注意,最后两个操作纯粹是符号。要执行查询,请调用 EntityValue。
绘制数据。