Wolfram Language

Reconhecimento de voz

Reconhecimento automático de voz, também conhecido como sistemas de conversão texto-fala, é o processo de reconhecer e converter automaticamente gravações faladas em texto. O reconhecimento de fala é muito usado em sistemas de transcrição automática de grande escala, assistentes virtuais e domésticos, sistemas de controle habilitados por voz, sistemas de ditado, sistemas telefônicos automatizados e muito mais.

A versão 12 traz SpeechRecognize para executar reconhecimento de fala automático.

Aqui está um sinal de fala encontrado na internet.

Visualize o espectrograma do sinal.

E aqui está o resultado do reconhecimento de fala naquele sinal. O processo de reconhecimento de fala é um passo para usar uma rede neural para processar uma transcrição bruta do sinal seguido do envio da transcrição através de um modelo de linguagem para corrigir erros de ortografia e muito mais.

Exemplos Relacionados

de en es fr ja ko zh