Wolfram言語

画像のセマンティックセグメンテーション

セマンティックセグメンテーションは場面の理解に必要な高レベルのタスクであり,その応用には自動運転の車,バーチャルリアリティ,人とコンピュータのインタラクション等がある.画像分類は,画像全体に対して予測する一方,セマンティックセグメンテーションは,画像の各画素を構成要素のクラスに分類することを目的とする.この例では訓練済みの画像セグメンテーションネットを使う方法を示す.このモデルはNetTrainを使って特定のデータ向けに調整することもできる.

Neural Net Repositoryから訓練済みネットを取り,そのリソースページから評価関数をコピーする.

このモデルのラベルリストを定義する.モデルの出力の整数がラベルリストの中の要素に対応する.

セグメンテーションクラスに従って各画素を可視化し,セグメンテーションをもとの画像の上に重ねる関数を書く.完璧ではないにしても,ほとんどのオブジェクトが正しくセグメントされていることが分かる.

関連する例

de en es fr ko pt-br zh