Wolfram Language

Reconhecimento de som

O som de um sinal é um descritor extremamente importante para sinais como fala ou instrumentos musicais. As técnicas modernas de aprendizado de máquina melhoraram de forma consistente a confiabilidade dessa operação.

Reconheça o som de um sinal monofônico usando PitchRecognize.

Use um método baseado em rede neural.

Você também pode importar e usar a rede neural de reconhecimento de som CREPE do Wolfram Neural Net Repository. Um HiddenMarkovProcess pode ser usado para interpretar a saída da rede em uma sequência de estimativas de frequência e sua confiabilidade.

A rede foi treinada para prever uma estimativa de som como uma distribuição de probabilidade em um conjunto de 360 classes de notas logarítmicas. Você pode definir uma função auxiliar para interpolar entre as previsões de classe fornecidas pela rede, assim como uma função que produza a frequência reconhecida e sua confiabilidade.

mostre o input completo da Wolfram Language

Reconheça o som e calcule a confiança correspondente.

Plote a frequência reconhecida com a confiança atribuída à cor.

Exemplos Relacionados

de en es fr ja ko zh