Wolfram Language

Examinez la parole à l'aide d'un réseau neuronal

Dans cet exemple, la parole est reconnue à l'aide de la fonction intégrée SpeechRecognize. On utilise également un réseau neuronal de Wolfram Neural Net Repository pour transcrire le signal dans une liste de caractères.

Commencez à partir d'un signal vocal synthétisé.

Identifiez la parole dans l'objet audio.

Maintenant, récupérez le réseau de reconnaissance vocale pré-entraîné.

Évaluez le réseau neuronal sur le discours synthétisé suivant. Le réseau renvoie une liste de caractères reconnus à partir de l'enregistrement audio.

Assemblez les lettres pour obtenir une version préliminaire du discours reconnu.

Le réseau a été entraîné à utiliser une perte CTC pour transformer la liste des trames de l'entrée en une liste de caractères, en tenant compte du fait qu'une seule lettre peut couvrir plusieurs trames.

Vous pouvez visualiser la sortie du réseau juste avant le décodage CTC pour obtenir les probabilités de toutes les lettres à tout moment. L'axe inférieur est étiqueté avec un décodage intermédiaire obtenu en prenant le caractère qui a la probabilité maximum dans chaque trame.

Exemples connexes

de en es ja ko pt-br zh