Wolfram Language

Inspecione fala usando uma rede neural

Este exemplo reconhece fala usando a função integrada SpeechRecognize. Uma rede neural do Wolfram Neural Net Repository também é usada para transcrever o sinal em uma lista de caracteres.

Comece de um sinal de fala sintetizado.

Reconheça o discurso no objeto de áudio.

Agora, pegue a rede de reconhecimento de fala pré-treinada.

Faça um teste da neural na seguinte fala sintetizada. A rede retorna uma lista de caracteres reconhecidos da gravação de áudio.

Junte personagens para obter uma versão preliminar do discurso reconhecido.

A rede foi treinada usando uma perda de CTC para mapear a lista de frames da entrada para uma lista de caracteres, levando em conta o fato de que uma única letra pode abranger vários frames.

Você pode visualizar a saída da rede antes da decodificação do CTC para obter as probabilidades de todas as letras em qualquer momento. O eixo inferior é legendado com uma decodificação intermediária obtida ao se considerar o caractere com a probabilidade máxima em cada frame.

Exemplos Relacionados

de en es fr ja ko zh