Wolfram 언어

웹 사이트에서 링크된 데이터 구하기

웹 사이트는 대부분의 경우 브라우저가 "인간"을 대신하여 수행하는 요청에 대해 "사람이 읽을 수 있는" 콘텐츠로 응답합니다. 추가 처리를 위해 데이터를 추출할 때는 "기계 판독 가능" 데이터를 요청할 수 있습니다.

버전 12에서는 "JSONLD" ("JSON"에 따른 형식, "LD"는 "Linked Data"를 의미)를 포함한 RDF (Resource Description Framework 자원 기술 프레임워크)의 Import와 Export를 위한 형식이 지원되게 되었습니다. 링크된 데이터는 HTTPRequest에서 적절한 "accept" 헤더를 지정하여 요청할 수 있습니다.

이 예는 MusicBrainz에서 유명한 탱고 오케스트라 지휘자인 Francisco Canaro의 앨범 트랙 정보를 가져옵니다.

먼저, 검색 상자를 사용하여 브라우저 링크를 클릭하는 등 사용하고 싶은 앨범을 선택합니다. 흥미 있는 앨범이 발견되면, 그 URL을 복사하여 변수에 저장합니다.

이 웹 사이트는 브라우저에서는 다음과 같이 보입니다.

링크된 데이터를 구하기 위해 "accept" 헤더로 JSON-LD media type을 지정하는 HTTPRequest를 작성합니다.

요청을 실행하고 "JSONLD" 가져오기를 사용하여 응답을 가져옵니다.

결과는 이 앨범에 대한 정보를 포함하는 RDFStore 객체입니다. 이제 SPARQLQuery 연산자를 적용하여 이 스토어에서 사용되는 모든 특성을 추출합니다.

모든 트랙에 대한 트랙 번호와 곡명을 구하는 쿼리를 씁니다.

다음은 샘플 트랙입니다.

트랙 번호는 "디스크. 트랙" 형식의 문자열입니다. 수치적으로 "number"가 정렬할 수 있도록 "트랙"을 추출하고 "Integer"로 변환합니다.

트랙 번호와 곡명만을 나타내는 Dataset를 표시합니다.

관련 예제

de en es fr ja pt-br zh