Anbindung an öffentliche MySQL-Instanzen
In der Bioinformatik gibt es eine Reihe von öffentlichen SQL-Endpunkten, die sehr große Datensätze enthalten. Dieses Beispiel zeigt, wie einfach es ist, sich mit einem zu verbinden und schnell Informationen zu extrahieren, die im Speicher nur sehr schwer zu verarbeiten wären.
Um Daten anzuzeigen, müssen Sie sich mit dem öffentlichen Endpunkt des ensembl-Projekts verbinden und die Schemainformationen für zwei Tabellen extrahieren.
Erstellen Sie einen EntityStore.
Registrieren Sie ihn anschließend.
Da Sie die Berechnung in die externe Datenbank auslagern, ist der Vorgang sehr schnell.
Es gibt über 2,5 Millionen Zeilen in der Tabelle und Sie konnten sie in Bruchteilen einer Sekunde zählen (einschließlich eines Netzwerk-Roundtrips).
Eine interessante Frage ist: Was sind die häufigsten Biotypen bei Genen? Gruppieren Sie zuerst die Gene nach Biotyp und zählen Sie sie anschließend.
Nehmen Sie dann eine Sortierung nach der Eigenschaft "count" vor und ermitteln Sie nur die 10 größten.
Beachten Sie, dass die letzten beiden Operationen rein symbolisch sind. Um die Abfrage auszuführen, rufen Sie EntityValue.
Plotten Sie die Daten.