Clasificación de un conjunto de audio usando transferencia de aprendizaje: Novedades en Wolfram Language 12

Clasificación de un conjunto de audio usando transferencia de aprendizaje

En ocasiones la cantidad de datos disponibles para entrenar una red es insuficiente para la tarea dispuesta. La transferencia de aprendizaje es una posible solución a este problema. En lugar de entrenar una red desde cero, es posible usar como un punto de salida una red que ya ha sido entrenada en una tarea distinta pero relacionada.

Descargue el ESC-50 dataset.

muestre la entrada completa de Wolfram Language

Importe los metadatos. El conjunto de datos consiste en una colección etiquetada de 2000 grabaciones de audio ambientales. Los archivos consisten en grabaciones de cinco segundos organizadas en 50 clases semánticas.

muestre la entrada completa de Wolfram Language

Inspeccione la muestra desde los metadatos.

Divida el conjunto de datos en subconjuntos de entrenamiento y prueba.

Vea las clases disponibles.

Construya una red de extractor de atributos eliminando las capas del clasificador en la red AudioIdentify.

Construya una red de clasificador lineal simple que se adjuntará al extractor de atributos.

En lugar de reentrenar toda la red y especificar una opción LearningRateMultipliers en NetTrain para entrenar solamente las capas de clasificación, usted puede recalcular los resultados de la red de extractor de atributos y entrenar el clasificador. Esto evita la evaluación redundante de toda la red.

Entrene la red de clasificador usando NetTrain.

Una la red de extractor de atributos y el clasificador entrenado usando NetJoin.

Usando ClassifierMeasurements calcule la precisión en los datos de prueba y grafique la matriz de confusión de las peores cuatro clases.