Wolfram Language

Treine um classificador de imagem personalizado

Algumas tarefas de classificação que são difíceis para os seres humanos acabam sendo bastante fáceis para as redes neurais. Por exemplo, muitas pessoas não conseguem se lembrar da diferença entre um camelo e um dromedário. Usando um procedimento simples de ajuste fino, uma rede neural pode ajudar.

No Wolfram Neural Net Repository, existem vários modelos treinados para identificar o objeto principal em uma imagem. Aqui está um modelo treinado no conjunto de dados de classificação ImageNet.

Em seu estado original, o modelo não consegue distinguir um camelo de um dromedário, pois há apenas um animal nos dados de treinamento do ImageNet.

No entanto, o modelo pode ser treinado novamente para ter um desempenho melhor nessa tarefa específica. Para executar o treinamento novamente, remova as últimas camadas de classificação e substitua-as por um classificador de duas classes.

Novos dados de treinamento podem ser coletados usando WebImageSearch.

Usando NetTrain, a rede é treinada nos novos dados, com 10% dos dados sendo reservados para medições de validação. Somente a última camada de classificação é treinada.

O novo modelo oferece uma classificação muito melhor.

Usando o mesmo procedimento, treine novamente outras três arquiteturas de classificação treinadas no ImageNet e compare a precisão da classificação.

Para uma tarefa simples como essa, a precisão é semelhante e não há necessidade de modelos mais poderosos, porém mais lentos. A rede simples ResNet é uma boa alternativa entre precisão e velocidade.

Exemplos Relacionados

de en es fr ja ko zh