Inspeccione una señal usando la red de identificación de audio: Novedades en Wolfram Language 12

Inspeccione una señal usando la red de identificación de audio

La red usada en AudioIdentify puede ser una potente herramienta para realizar otras tareas de análisis de audio. Este ejemplo modifica la red para obtener probabilidades en el tiempo como un resultado resuelto en el tiempo.

Importe la red desde el Repositorio de redes neuronales Wolfram.

Aplique la red a un objeto de Audio.

La red fue entrenada en el conjunto de datos AudioSet, donde cada señal de audio es anotada con las clases de sonido y fuentes que son presentadas en la grabación.

Como consecuencia las probabilidades de cada clase en la salida no son mutuamente exclusivas.

El núcleo de la red toma un segmento de tamaño fijo del espectograma de mel de la señal de entrada y es mapeado sobre otros segmentos que se superponen usando NetMapOperator.

Esta es la red principal.

Usted puede calcular este resultado en la señal del ejemplo.

El resultado de esto es la secuencia de probabilidades independientes para cada clase calculada en cada segmento. Dado que está buscando por todas las clases presentadas en la señal, tome la máxima en el tiempo en lugar del promedio.

Al hacer un poco de cirugía, usted puede generar una red de salidas de probabilidades de clase para cada segmento.

Usando WebAudioSearch, usted puede recolectar algunos sonidos de instrumentos y unirlos.

Usted puede definir una función para calcular el resultado neto, vea a las clases n más probables en toda la secuencia y genere el resultado de estas probabilidades en el tiempo.

Visualice la forma de onda, junto con las probabilidades para las 10 clases más probables como evolucionan en el tiempo.