Wolfram 언어

공개 MySQL의 인스턴스에 연결하기

생물 정보학은 매우 큰 데이터 집합을 포함한 수많은 공개 SQL의 엔드 포인트가 존재합니다. 이 예는 쉽게 메모리에 연결하고 메모리에서 매우 처리가 곤란한 정보를 빠르게 추출하는 방법을 보여줍니다.

데이터를 보기 위해서는 ensembl 프로젝트가 제공하는 공개 엔드 포인트에 연결하고 두 테이블에 대한 스키마 정보를 추출합니다.

이제 EntityStore를 구축합니다.

이것을 등록할 수 있습니다.

계산은 외부 데이터베이스에 맡기기 때문에 모든 것을 매우 빠른 속도로 처리할 수 있습니다.

표에는 250만 개 이상의 행이 포함되어 있으며, 네트워크 왕복 시간을 포함하여 이를 순식간에 계산할 수 있습니다.

이번에는 유전자의 가장 흔한 바이오 유형이 무엇에 대해 알아봅니다. 먼저, 바이오 유형별로 그룹화하고 유전자를 셉니다.

그런 다음 "count" 특성별로 정렬하고 가장 큰 10 개만 가져옵니다.

마지막 두 개는 순수하게 기호적 작업임에 주의합니다. 쿼리를 실행하기 위해 EntityValue를 호출합니다.

데이터를 플롯합니다.

관련 예제

de en es fr ja pt-br zh