Wolfram Language

Ein audiobasiertes Frage-Antwort-System erstellen

Dieses Beispiel zeigt, wie Konvertierungen zwischen Audiosignalen und textuellen Transkriptionen einen großen Bereich von sprachaktivierten Anwendungen ermöglichen können, wie z.B. die Beantwortung von Textfragen mit aufgezeichneten Fragen und synthetisierten Antworten. Gesprochene Sprache kann mit SpeechRecognize, in Text umgewandelt werden, und Text kann mit SpeechSynthesize in Sprache umgewandelt werden.

Beginnen Sie, indem Sie den Text der Eröffnungsreden des Präsidenten herunterladen.

Wählen Sie einen Teil einer der Reden aus, die als Kontext für die Beantwortung von Fragen verwendet werden soll.

Nehmen Sie nun die Frage mit AudioCapture auf.

Transkribieren Sie die aufgezeichnete Frage mit SpeechRecognize.

Nun können Sie die Frage mit Hilfe der Textverarbeitung beantworten. Verwenden Sie FindTextualAnswer, um die wahrscheinlichste Antwort auf die Frage zu finden.

Verwenden Sie SpeechSynthesize, um das Ergebnis in ein Audio-Objekt zu konvertieren. Sie können auch zwei verschiedene Stimmen aus $VoiceStyles auswählen, um den umgebenden Kontext bzw. die Antwort darzustellen.

Definieren Sie eine Funktion zur Sprachsynthese mit einer bestimmten Stimme für die jeweilige Eingabe.

Synthetisieren und kombinieren Sie Teile der Sprache.

Verwandte Beispiele

en es fr ja ko pt-br zh