Wolfram言語

画像処理と信号処理

ディープラーニングを使った画像認識

ディープラーニングは,数多くの画像処理およびコンピュータビジョンの問題に非常にうまく適用することができる.NetChainNetTrainを使って,画像で与えられた手書きの数字を分類するニューラルネットワークを定義,訓練することができる.

手書きの数字についてのMNISTデータセットから,訓練データと検証データを得る.

In[1]:=
Click for copyable input
resource = ResourceObject["MNIST"]; trainingData = ResourceData[resource, "TrainingData"]; testData = ResourceData[resource, "TestData"];
In[2]:=
Click for copyable input
RandomSample[trainingData, 5]
Out[2]=

28×28のグレースケール画像を認識するように構築された,たたみ込みニューラルネットワークを設計する.

In[3]:=
Click for copyable input
lenet = NetChain[ {ConvolutionLayer[20, 5], Ramp, PoolingLayer[2, 2], ConvolutionLayer[50, 5], Ramp, PoolingLayer[2, 2], FlattenLayer[], 500, Ramp, 10, SoftmaxLayer[]}, "Output" -> NetDecoder[{"Class", Range[0, 9]}], "Input" -> NetEncoder[{"Image", {28, 28}, "Grayscale"}] ]
Out[3]=

3度の訓練でネットワークを訓練する.

In[4]:=
Click for copyable input
lenet = NetTrain[lenet, trainingData, ValidationSet -> testData, MaxTrainingRounds -> 3];
Out[4]=

訓練されたネットワークを,検証集合からランダムにサンプリングされた画像に直接使って評価する.

In[5]:=
Click for copyable input
imgs = Keys @ RandomSample[testData, 5]; Thread[imgs -> lenet[imgs]]
Out[5]=

関連する例

de en es fr ko pt-br ru zh