Wolfram Language

Inspectez un signal à l'aide du réseau d'identification audio

Le réseau utilisé dans AudioIdentify peut être un outil très puissant pour effectuer d'autres tâches d'analyse audio. Cet exemple modifie le réseau pour obtenir des probabilités au fil du temps en tant que résultat résolu en fonction du temps.

Importez le réseau à partir de Wolfram Neural Net Repository.

Appliquez le réseau à un objet Audio.

Le réseau a été entraîné sur le jeu de données AudioSet, dans lequel chaque signal audio est annoté avec les classes et les sources sonores qui sont présentes dans l'enregistrement.

Par conséquent, les probabilités de chaque classe de la sortie ne sont pas mutuellement exclusives.

Le cœur du réseau reçoit un morceau de taille fixe du spectrogramme de Mel provenant du signal d'entrée et est mappée sur des morceaux qui se chevauchent en utilisant NetMapOperator.

C'est le réseau central.

Vous pouvez calculer ce résultat à partir du signal de l'exemple.

Il en résulte la séquence de probabilités indépendantes pour chaque classe calculée sur chaque segment. Puisque vous recherchez toutes les classes présentes dans le signal, prenez le maximum au fil du temps au lieu de la moyenne.

En faisant quelques réglages, vous pouvez générer un réseau qui fournit les probabilités de classe pour chaque segment.

À l'aide de WebAudioSearch, vous pouvez collecter certains sons d'instruments et les assembler.

Vous pouvez définir une fonction pour calculer le résultat du réseau, examiner les n classes les plus probables dans la séquence entière et sortir ces probabilités au fil du temps.

Visualisez la forme d'onde, ainsi que les probabilités pour les 10 classes les plus probables au fur et à mesure de leur évolution dans le temps.

Exemples connexes

de en es ja ko pt-br zh