Wolfram Language

Entrenamiento de un clasificador de imágenes personalizado

Algunas tareas de clasificación que son difíciles para los humanos resultan fáciles para redes neuronales. Por ejemplo, muchas personas no puede recordar la diferencia entre un camello y un dromedario. Usando un simple procedimiento de ajuste fino, una red neuronal puede ayudar.

En el Repositorio de redes neuronales Wolfram, existen varios modelos entrenados para identificar el objeto principal en una imagen. Aquí está un modelo entrenado en el conjunto de datos de clasificación ImageNet.

En su estado original, no es bueno diferenciando entre un camello y un dromedario: solo un animal es presentado en los datos de entrenamiento de ImageNet.

Sin embargo, el modelo puede ser re-entrenado para ser mejor en esta tarea específica. Para hacer el re-entrenamiento, elimine las capas de clasificación final y reemplácelas con un clasificador de dos clases.

Los nuevos datos de entrenamiento pueden ser agrupados usando WebImageSearch.

Usando NetTrain, la red es entrenada en los nuevos datos, ahorrando un 10% para las medidas de validación. Solo la capa de clasificación final es entrenada.

El nuevo modelo genera una mejor clasificación.

Usando el mismo procedimiento, re-entrene otras tres arquitecturas de clasificación entrenadas en ImageNet y compare la precisión de clasificación.

Para una simple tarea como esta, la precisión es similar y no hay necesidad para modelos más potentes y más lentos. El pequeño ResNet es un buen equilibrio entre precisión y velocidad.

Ejemplos relacionados

de en fr ja ko pt-br zh