Wolfram Language

Traitement des images et des signaux

Reconnaissance d'images à l'aide d'un apprentissage en profondeur

L'apprentissage profond peut être appliqué avec succès à de nombreux problèmes de traitements d'images et et de vision par ordinateur. À l'aide de NetChain et de NetTrain, vous pouvez définir et entraîner un réseau neuronal qui catégorise un chiffre manuscrit à partir d'une image.

Obtenez des données d'apprentissage et de validation à partir de la base de données MNIST de chiffres manuscrits.

In[1]:=
Click for copyable input
resource = ResourceObject["MNIST"]; trainingData = ResourceData[resource, "TrainingData"]; testData = ResourceData[resource, "TestData"];
In[2]:=
Click for copyable input
RandomSample[trainingData, 5]
Out[2]=

Dessinez un réseau neuronal de convolution pour reconnaître des images en niveaux de gris 28×28.

In[3]:=
Click for copyable input
lenet = NetChain[ {ConvolutionLayer[20, 5], Ramp, PoolingLayer[2, 2], ConvolutionLayer[50, 5], Ramp, PoolingLayer[2, 2], FlattenLayer[], 500, Ramp, 10, SoftmaxLayer[]}, "Output" -> NetDecoder[{"Class", Range[0, 9]}], "Input" -> NetEncoder[{"Image", {28, 28}, "Grayscale"}] ]
Out[3]=

Entraînez le réseau pendant trois séances d'apprentissage.

In[4]:=
Click for copyable input
lenet = NetTrain[lenet, trainingData, ValidationSet -> testData, MaxTrainingRounds -> 3];
Out[4]=

Évaluez le réseau entraîneé directement sur les images échantillonnées au hasard à partir de l'ensemble de validation.

In[5]:=
Click for copyable input
imgs = Keys @ RandomSample[testData, 5]; Thread[imgs -> lenet[imgs]]
Out[5]=

Exemples connexes

de en es ja ko pt-br ru zh