Wolfram Language

Reconnaissance de la hauteur tonale

La hauteur tonale d'un signal est un descripteur extrêmement important pour des signaux comme la parole ou les instruments de musique. Les techniques modernes d'apprentissage automatique ont constamment amélioré la fiabilité de cette opération.

Reconnaissez la hauteur tonale d'un signal monophonique à l'aide de PitchRecognize.

Utilisez une méthode basée sur un réseau neuronal.

Vous pouvez également importer et utiliser le réseau neuronal de reconnaissance de hauteur tonale CREPE à partir de Wolfram Neural Net Repository. Un processus HiddenMarkovProcess peut être utilisé pour interpréter la sortie du réseau dans une séquence d'estimations de fréquence et leur fiabilité.

Le réseau a été entraîné à prédire une estimation de la hauteur tonale comme une distribution de probabilité sur un ensemble de 360 classes logarithmiques de hauteur tonale. Vous pouvez définir une fonction d'aide pour interpoler entre les prédictions de classe fournies par le réseau ainsi qu'une fonction qui fournit la fréquence reconnue et sa fiabilité.

Montrer l'entrée complète de Wolfram Language

Reconnaissez la hauteur tonale et calculez la fiabilité correspondante.

Tracez la fréquence reconnue avec la fiabilité attribuée à la couleur.

Exemples connexes

de en es ja ko pt-br zh