Inspecione fala usando uma rede neural
Este exemplo reconhece fala usando a função integrada SpeechRecognize. Uma rede neural do Wolfram Neural Net Repository também é usada para transcrever o sinal em uma lista de caracteres.
Comece de um sinal de fala sintetizado.
Reconheça o discurso no objeto de áudio.
Agora, pegue a rede de reconhecimento de fala pré-treinada.
Faça um teste da neural na seguinte fala sintetizada. A rede retorna uma lista de caracteres reconhecidos da gravação de áudio.
Junte personagens para obter uma versão preliminar do discurso reconhecido.
A rede foi treinada usando uma perda de CTC para mapear a lista de frames da entrada para uma lista de caracteres, levando em conta o fato de que uma única letra pode abranger vários frames.
Você pode visualizar a saída da rede antes da decodificação do CTC para obter as probabilidades de todas as letras em qualquer momento. O eixo inferior é legendado com uma decodificação intermediária obtida ao se considerar o caractere com a probabilidade máxima em cada frame.