Construcción de un sistema de preguntas y respuestas habilitado para audio: Novedades en Wolfram Language 12

Construcción de un sistema de preguntas y respuestas habilitado para audio

Este ejemplo muestra cómo las conversiones entre las señales de audio y las transcripciones textuales pueden permitir un dominio largo de aplicaciones habilitadas para voz, tales como responder a una pregunta textual usando preguntas grabadas y respuestas sintetizadas. El habla puede ser convertido a texto usando SpeechRecognize, y el texto puede ser convertido a voz usando SpeechSynthesize.

Comience por descargar el texto de discursos presidenciales inaugurales.

Seleccione una parte de uno de los discursos para usar como contexto para responder preguntas.

Ahora grabe la pregunta usando AudioCapture.

Transcriba la pregunta grabada con SpeechRecognize.

Ahora puede usar el procesamiento de texto para responder la pregunta. Use FindTextualAnswer para identificar la respuesta más probable a la pregunta.

Use SpeechSynthesize para convertir el resultado en un objeto de Audio. Usted puede también elegir dos voces distintas de $VoiceStyles para representar el contexto y la respuesta, respectivamente.

Defina una función para sintetizar habla usando una voz específica dada para una entrada.

Sintetice y combine partes del habla.