Créez un système de questions-réponses basé sur l'audio: Nouveautés de Wolfram Language 12

Créez un système de questions-réponses basé sur l'audio

Cet exemple illustre comment les conversions entre les signaux audio et les transcriptions textuelles peuvent activer un large domaine d'applications vocales, telles que les réponses textuelles à des questions enregistrées et les réponses synthétisées. Le discours peut être converti en texte à l'aide de SpeechRecognize, et le texte peut être converti en discours avec SpeechSynthesize.

Commencez par télécharger le texte des discours inauguraux présidentiels.

Sélectionnez une partie de l'un des discours pour l'utiliser comme contexte afin de répondre aux questions.

Enregistrez maintenant la question à l'aide d'AudioCapture.

Transcrivez la question enregistrée avec SpeechRecognize.

Vous pouvez maintenant utiliser le traitement de texte pour répondre à la question. Utilisez FindTextualAnswer pour identifier la réponse la plus probable à cette question.

Utilisez SpeechSynthesize pour convertir le résultat en objet Audio. Vous pouvez également choisir deux voix différentes parmi $VoiceStyles pour représenter le contexte environnant et la réponse, respectivement.

Définissez une fonction pour synthétiser le discours en utilisant une voix spécifique pour l'entrée donnée.

Synthétisez et combinez les parties du discours.