Wolfram Language

Processamento de imagens e sinais

Reconhecimento de imagem usando aprendizagem profunda

Aprendizagem profunda pode ser aplicada a muitos problemas de processamento de imagens e visão computacional com grande sucesso. Usando NetChain e NetTrain, você pode definir e treinar uma rede neural que classifique um dígito escrito à mão a uma dada imagem.

Obtenha dados treinamento e validação do banco de dados MNIST de dígitos escritos à mão.

In[1]:=
Click for copyable input
resource = ResourceObject["MNIST"]; trainingData = ResourceData[resource, "TrainingData"]; testData = ResourceData[resource, "TestData"];
In[2]:=
Click for copyable input
RandomSample[trainingData, 5]
Out[2]=

Projete uma rede neural de convolução arquitetada para o reconhecer imagens em tons de cinza 28×28.

In[3]:=
Click for copyable input
lenet = NetChain[ {ConvolutionLayer[20, 5], Ramp, PoolingLayer[2, 2], ConvolutionLayer[50, 5], Ramp, PoolingLayer[2, 2], FlattenLayer[], 500, Ramp, 10, SoftmaxLayer[]}, "Output" -> NetDecoder[{"Class", Range[0, 9]}], "Input" -> NetEncoder[{"Image", {28, 28}, "Grayscale"}] ]
Out[3]=

Treine a rede com três rodadas de treinamento.

In[4]:=
Click for copyable input
lenet = NetTrain[lenet, trainingData, ValidationSet -> testData, MaxTrainingRounds -> 3];
Out[4]=

Execute a rede treinada diretamente sobre as imagens da amostra aleatória do conjunto de validação.

In[5]:=
Click for copyable input
imgs = Keys @ RandomSample[testData, 5]; Thread[imgs -> lenet[imgs]]
Out[5]=

Exemplos Relacionados

de en es fr ja ko ru zh