Wolfram Language

Segmentez les images sémantiquement

La segmentation sémantique est une tâche de haut niveau qui est essentielle à la compréhension de la scène : les applications incluent les véhicules auto-propulsés, la réalité virtuelle, l'interaction homme-ordinateur, etc. Alors que la classification de l'image fait une prédiction pour l'image entière, la segmentation sémantique vise à classer chaque pixel de l'image en classes constitutives. Cet exemple illustre l'utilisation d'un réseau de segmentation d'images pré-entraîné. Ce modèle peut également être adapté à des données spécifiques en utilisant NetTrain.

Récupérez un réseau pré-entraîné dans Neural Net Repository et copiez la fonction d'évaluation à partir de sa page de ressources.

Définissez la liste des étiquettes pour ce modèle. Les nombres entiers dans la sortie du modèle correspondent aux éléments de la liste des étiquettes.

Rédigez une fonction pour visualiser chaque pixel en fonction de sa classe de segmentation, et superposez la segmentation sur l'image originale. Même s'ils ne sont pas parfaits, vous pouvez voir que la plupart des objets ont été correctement segmentés.

Exemples connexes

de en es ja ko pt-br zh