Reconhecimento de voz
Reconhecimento automático de voz, também conhecido como sistemas de conversão texto-fala, é o processo de reconhecer e converter automaticamente gravações faladas em texto. O reconhecimento de fala é muito usado em sistemas de transcrição automática de grande escala, assistentes virtuais e domésticos, sistemas de controle habilitados por voz, sistemas de ditado, sistemas telefônicos automatizados e muito mais.
A versão 12 traz SpeechRecognize para executar reconhecimento de fala automático.
Aqui está um sinal de fala encontrado na internet.
Visualize o espectrograma do sinal.
E aqui está o resultado do reconhecimento de fala naquele sinal. O processo de reconhecimento de fala é um passo para usar uma rede neural para processar uma transcrição bruta do sinal seguido do envio da transcrição através de um modelo de linguagem para corrigir erros de ortografia e muito mais.