Wolfram Language

Extraia propriedades usando uma rede neural

A rede usada em AudioIdentify pode ser usada não apenas para reconhecer sons, mas também para extrair propriedades de uma gravação. Isso permite que qualquer sinal seja incorporado em um espaço semanticamente significativo, onde similaridades e distâncias podem ser calculadas.

Obtenha a rede usada em AudioIdentify no Wolfram Neural Net Repository.

Extraia o núcleo da rede: o sinal é dividido em fragmentos de tamanho fixo e essa rede é aplicada ao espectrograma mel de cada um desses fragmentos. Para fazer isso, você pode usar NetExtract.

Remova as últimas camadas responsáveis pela tarefa de classificação e insira novamente a rede resultante no NetChain original. Essa rede produzirá um vetor de tamanho fixo e semanticamente significativo para cada entrada de áudio.

Visualize as propriedades de uma única gravação de áudio.

Use a rede como o extrator de propriedades.

Use outro extrator de propriedades pré-treinado do repositório.

Exemplos Relacionados

de en es fr ja zh