Bilder semantisch segmentieren
Semantische Segmentierung ist eine High-Level-Aufgabe und der Schlüssel zur digitalen Szenenverarbeitung: Anwendungen sind selbstfahrende Fahrzeuge, Virtual Reality, Mensch-Computer-Interaktion, etc. Während die Bildklassifizierung eine Vorhersage für das gesamte Bild darstellt, zielt die semantische Segmentierung darauf ab, jedes Pixel des Bildes in konstituierende Klassen einzuteilen. Dieses Beispiel zeigt, wie man ein vortrainiertes Bildsegmentierungsnetz verwendet. Dieses Modell kann mit NetTrain auch auf spezifische Daten abgestimmt werden.
Wählen Sie ein vortrainiertes Netz aus dem Neural Net Repository und kopieren Sie die Evaluationsfunktion von dessen Ressourcen-Seite.
Definieren Sie die Liste der Klassenbezeichnungen für dieses Modell. Ganzzahlen in der Ausgabe des Modells entsprechen Elementen in der Label-Liste.
Schreiben Sie eine Funktion, um jedes Pixel entsprechend seiner Segmentierungsklasse zu visualisieren, und überlagern Sie die Segmentierung über dem Originalbild. Obwohl das Ergebnis nicht perfekt ist, können Sie sehen, dass die meisten Objekte korrekt segmentiert wurden.