Wolfram Language

Extracción de atributos usando una red neuronal

La red usada en AudioIdentify puede ser utilizada no solo para reconocer sonidos sino también para extraer atributos de una grabación. Esto permite que cualquier señal sea incrustada en un espacio semánticamente significativo, donde similitudes y distancias pueden ser calculadas.

Obtenga una red usada en AudioIdentify desde el Repositorio de redes neuronales Wolfram.

Extraiga el núcleo de la red: la señal es dividida en segmentos de tamaño fijo, y esta red es aplicada al espectrograma de mel de cada uno de los segmentos. Para hacer esto, usted puede usar NetExtract.

Elimine algunas de las últimas capas que están a cargo de la clasificación y reinserte la red resultante en la NetChain original. Esta red producirá un vector de tamaño fijo semánticamente significativo para cada entrada de audio.

Visualice los atributos para una sola grabación de audio.

Use la red como un extractor de atributos.

Use otro extractor de atributos preentrenado del repositorio.

Ejemplos relacionados

de en fr ja pt-br zh