Interrogez des données liées à partir d'un site Internet
Les sites Internet répondent généralement avec un contenu "lisible par l'homme" lorsqu'un navigateur (exploité par un "humain") fait une requête. Pour extraire les données en vue de leur traitement ultérieur, on peut interroger des données "lisibles par la machine" à la place.
La version 12 intègre la prise en charge de divers formats d'importation et d'exportation RDF (Resource Description Framework) dont "JSONLD". Ce dernier est un format basé sur "JSON" où "LD" fait référence à "Linked Data" (données liées). On peut interroger des données liées en spécifiant un en-tête "accept" (accepter) approprié dans une requête HTTPRequest.
Cet exemple importe des informations de piste audio provenant d'un album du célèbre chef d'orchestre de tango Francisco Canaro à partir de MusicBrainz.
Commencez par naviguer vers l'album de votre choix, par exemple en utilisant la boîte de recherche et en cliquant sur les liens dans votre navigateur. Une fois que vous avez trouvé un album intéressant, copiez l'URL et sauvegardez-le dans une variable.
Voici à quoi ressemble le site Internet dans un navigateur.
Pour interroger des données liées, créez une requête HTTPRequest qui spécifie le type de média JSON-LD dans son en-tête "accept".
Exécutez la requête et importez la réponse en utilisant l'importateur "JSONLD".
Il en résulte un objet RDFStore qui contient des informations relatives à cet album. Appliquez maintenant l'opérateur SPARQLQuery pour récupérer toutes les propriétés utilisées dans le stock.
Rédigez une requête qui demande le numéro et le nom de la piste pour toutes les pistes audio.
Voici un exemple de piste audio.
Les numéros de piste audio sont des chaînes de caractères du format disk.track. Extrayez la piste et convertissez-la en "Integer" afin de pouvoir la trier par "numéro" et dans l'ordre.
Visualisez un Dataset qui n'affiche que le numéro et le titre de la piste.