Crie um sistema de perguntas e respostas acionado por áudio: Novos Recursos do Wolfram Language 12

Crie um sistema de perguntas e respostas acionado por áudio

Este exemplo mostra como as conversões entre sinais de áudio e transcrições de texto podem habilitar um grande domínio de aplicativos habilitados para voz, respondendo perguntas de texto com perguntas gravadas e respostas sintetizadas. A fala pode ser convertida em texto usando SpeechRecognize, e o texto pode ser convertido em fala usando SpeechSynthesize.

Comece fazendo o download do texto dos discursos inaugurais presidenciais.

Selecione uma parte de um dos discursos para usar como contexto para responder as perguntas.

Agora grave a pergunta usando AudioCapture.

Transcreva a pergunta gravada com SpeechRecognize.

Agora você pode usar o processamento de texto para responder à pergunta. Use FindTextualAnswer para identificar a resposta mais provável para a pergunta.

Use SpeechSynthesize para converter o resultado em um objeto de Audio. Você também pode escolher duas vozes diferentes em $VoiceStyles para representar o contexto e a resposta mais próximos, respectivamente.

Defina uma função para sintetizar a fala usando uma voz específica para o input dado.

Sintetize e combine partes do discurso.