Segmentierung und Klassifizierung—ArcGIS Pro

Mit der Spatial Analyst-Lizenz verfügbar.

Werkzeuge zur Segmentierung und Klassifizierung bieten eine Möglichkeit, Features von auf Objekten basierenden Bilddaten zu extrahieren. Diese Objekte werden über eine Bildsegmentierung erstellt, bei der dicht beieinander liegende Pixel, die ähnliche Spektraleigenschaften aufweisen, in einem Segment gruppiert werden. Segmente mit bestimmten Formen, Spektral- und räumlichen Eigenschaften lassen sich danach weiter in Objekte gruppieren. Die Objekte können dann in Klassen zusammengefasst werden, die reale Features auf der Erdoberfläche darstellen. Bildklassifizierungen lassen sich auch für Pixel-Bilddaten ausführen, beispielsweise ursprünglich unsegmentierte Bilder.

Die objektorientierte Feature-Extraktion wird von Werkzeugen unterstützt, die drei Funktionsbereiche abdecken: Bildsegmentierung, Ableitung von Analysedaten zu den Segmenten und Klassifizierung. Die ausgegebenen Daten eines Werkzeugs dienen als Eingabe für die nachfolgenden Werkzeuge, wobei das Ziel darin besteht, eine sinnvolle objektorientierte Feature-Class-Karte zu erstellen. Der objektorientierte Prozess ähnelt dem herkömmlichen pixelbasierten Bildklassifizierungsprozess, bei dem geordnete und ungeordnete Klassifizierungstechniken zum Einsatz kommen. Statt Pixeln werden in diesem Prozess Segmente – die man sich als Superpixel vorstellen kann – klassifiziert. Jedes Segment (oder Superpixel) liegt in Form eines Satzes von Attributen vor, anhand dessen die Klassifizierungswerkzeuge das klassifizierte Bild erstellen.

Nachstehend wird ein Geoverarbeitungsmodell beschrieben, in dem die Abläufe bei der objektorientierten Feature-Extraktion dargestellt werden.

Workflow der objektorientierten Feature-Extraktion

Bildsegmentierung

Die Bildsegmentierung basiert auf dem Mean Shift-Ansatz. Bei dieser Technik wird ein bewegliches Fenster verwendet, mit dem ein durchschnittlicher Pixelwert berechnet wird, um zu ermitteln, welche Pixel in jedem Segment enthalten sein sollten. Während sich das Fenster über das Bild bewegt, wird der Wert ständig neu berechnet, um die Eignung jedes einzelnen Segments sicherzustellen. Daraus ergibt sich eine Gruppierung von Bildpixeln in einem Segment, das sich durch eine Durchschnittsfarbe auszeichnet.

Das Werkzeug Mean Shift-Segmentierung akzeptiert beliebige von Esri unterstützte Raster und gibt ein segmentiertes 3-Band, 8-Bit-Farb-Bild aus, dessen Schlüsseleigenschaft auf Segmentiert festgelegt wird. Die Segmentmerkmale des Bildes sind von drei Parametern abhängig: Spektraldetail, räumliches Detail und minimale Segmentgröße. Sie können den Detailumfang der Merkmale eines Features von Interesse beliebig ändern. Wenn Sie beispielsweise vor allem an undurchlässigen Features statt an einzelnen Gebäuden interessiert sind, stellen Sie den Parameter für räumliche Details auf einen niedrigen Wert ein; je niedriger der Wert, desto mehr Glättung und weniger Details erhalten Sie.

Nachstehende Abbildung zeigt eine segmentierte WorldView-2-Szene (mit freundlicher Genehmigung von DigitalGlobe) in Infrarot. Das segmentierte Bild zeigt ähnliche Regionen, die nahezu fleckenlos in Objekte gruppiert sind. Es generalisiert den Bereich, um alle Features als größere, kontinuierliche Fläche zu belassen.

WorldView-2-Szene in Infrarot, bereitgestellt von DigitalGlobe.

Segmentiertes Bild auf der Grundlage der WorldView-2-Szene.

Quellen:

D. Comanicu, P. Meer: Mean shift: A robust approach toward feature space analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, no. 5, Mai 2002.
P. Meer, B. Georgescu: Edge detection with embedded confidence. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 23, no. 12, Dezember 2001.
C. Christoudias, B. Georgescu, P. Meer: Synergism in low level vision. 16th International Conference of Pattern Recognition, Track 1 - Computer Vision and Robotics, Quebec City, Kanada, August 2001.

Trainingsgebietdaten

Bei der Erfassung von Trainingsgebietdaten geht es darum, eine Gruppe von Pixeln mit bestimmten Eigenschaften aus dem Bild abzugrenzen. Anschließend erfolgt ein statistischer Vergleich aller Pixel des Bildes mit der Klassendefinition, die Sie angegeben und einer bestimmten Klasse zugewiesen haben. Trainingsgebiete sollten keine unerwünschten Pixel enthalten, die der Sie interessierenden Klasse nicht angehören. Wenn Sie für jede Klasse ausschließlich die korrekten Pixel auswählen, sieht das Ergebnis häufig wie eine normale Gaußsche Glocke aus. Achten Sie darauf, dass Ihr als Trainingsgebiet gewähltes Polygon stets eine aussagekräftige Anzahl an Pixeln enthält, besonders bei der Nutzung von Maximal-Likelihood-Klassifikatoren. Ein 10x10-Pixelblock entspricht 100 Pixeln, was eine vernünftige, statistisch signifikante Größe für ein Trainingspolygon darstellt.

Ein segmentiertes Raster-Dataset unterscheidet sich von einem Pixelbild darin, dass jedes Segment (zuweilen auch Super-Pixel genannt) durch ein Werte-Set dargestellt wird. Ein Trainingsgebiet-Polygon mit 100 Pixeln aus einem Bild lässt sich leicht erstellen; viel schwieriger ist es jedoch, 100 Segmente aus einem segmentierten Raster-Dataset zu erhalten.

Parametrische Klassifikatoren, darunter der Klassifikator für die maximale Wahrscheinlichkeit, benötigen eine statistisch signifikante Anzahl von Stichproben, um eine aussagekräftige Wahrscheinlichkeitsdichtefunktion erstellen zu können. Um statistisch signifikante Stichproben zu erhalten, sollten Sie mit mindestens 20 Stichproben pro Klasse arbeiten. Das heißt, dass für jede Klasse, z. B. nackter Erdboden, blattlose Bäume oder Asphalt, mindestens 20 Segmente vorhanden sein sollten, um die jeweilige Feature-Class zu definieren.

Glätten wirkt sich auf die Größe und Homogenität eines Segments aus. Ein segmentiertes Raster, für das ein hoher Glättungsfaktor gewählt wurde, enthält sicherlich umfangreiche Segmente, in deren Quellbild verschiedene Typen von Features vorhanden sind. Aufgrund des Glättungseffekts empfiehlt es sich, Trainingsgebiete aus dem segmentierten Raster-Dataset zu sammeln. Damit lässt sich sicherstellen, dass die Trainingsgebiete aus unterschiedlichen Einzelsegmenten stammen.

Analytische Informationen

Die dem segmentierten Layer zugeordneten analytischen Informationen werden vom Klassifikator-Trainingswerkzeug berechnet und sind vom angegebenen Klassifikatortyp abhängig. Verwenden Sie das zur Klassifizierung Ihrer Daten geeignete Trainingswerkzeug:


Klassifikator	Beschreibung
ISO-Cluster-Klassifikator trainieren	Generiert eine Esri Classifier Definition-Datei (.ecd) anhand der ISO-Cluster-Klassifizierung.
Maximum-Likelihood-Klassifikator trainieren	Generiert eine Esri Classifier Definition-Datei (.ecd) anhand der Klassifizierungsdefinition des Maximum-Likelihood-Klassifikators. Maximum-Likelihood-Klassifikator basiert auf Bayes' Theorem. Es geht davon aus, dass die Proben in jeder Klasse der normalen Verteilung folgen, und berechnet die Wahrscheinlichkeiten aller Klassen für jede Probe. Danach wird die Klasse mit der höchsten Wahrscheinlichkeit der Probe zugeordnet.
Support Vector Machine-Klassifikator trainieren	Generiert eine Esri Classifier Definition-Datei (.ecd) anhand der Klassifizierungsdefinition für Support Vector Machine (SVM). Der SVM-Klassifikator versucht die Support-Vektoren und die Separations-Hyperebene für jedes Klassenpaar zu finden, um die Unterschiede zwischen Klassen zu maximieren. Es bietet eine leistungsfähige, moderne überwachte Klassifizierungsmethode, die bedeutend weniger Proben als die Maximum-Likelihood-Klassifikatoren benötigt und keine normale Verteilung voraussetzt. Dies ist gewöhnlich im segmentbasierten Klassifizierungs-Raster-Eingang oder einem Standardbild der Fall. SVM wird häufig von Forschern verwendet.
Random Trees-Klassifikator trainieren	Generiert eine Esri Classifier Definition-Datei (.ecd) anhand der Random-Trees-Klassifizierung. Der Random Trees-Klassifikator ist eine Sammlung von Entscheidungsstruktur-Klassifikatoren, die die Anfälligkeit einzelner Entscheidungsstrukturen im Hinblick auf Überanpassung umgeht. Wie bei SVM benötigt ein Random Trees-Klassifikator nur wenige Trainingsgebiete oder setzt normale Verteilung voraus. Es ist eine relativ neue Klassifizierungsmethode, die von Forschern häufig verwendet wird.

Die Trainingswerkzeuge verarbeiten das zu klassifizierende Bild, einen optionalen segmentierten Layer und Polygon-Daten des Trainingsgebiets, um die entsprechende Datei für Klassifikator-Definition zu erstellen. Die Standarddatei für das Trainingsgebiet wird in den überwachten Klassifikatoren verwendet.

Die Datei für Klassifikator-Definition (.ecd) basiert auf den angegebenen Klassifikatoren und Interessenattributen, weshalb für die jeweiligen Klassifikatoren, Eingabe-Raster und -Attribute eine individuelle Datei für Klassifikator-Definition erzeugt wird. Sie ähnelt einer Klassifizierungs-Signaturdatei, ist aber allgemeiner gehalten, da sie jeden beliebigen Klassifikator unterstützt, und die erstellte Datei für Klassifikator-Definition ist auf die jeweilige Kombination aus Quelldaten und Klassifikator speziell zugeschnitten.

Die Datei für Klassifikator-Definition kann auf jedem beliebigen Raster basieren, wobei die Raster nicht zwingend segmentiert sein müssen. Beispielsweise wird ein segmentiertes Raster aus IKONOS-Multispektraldaten abgeleitet, und deren Statistik- und Analyseattributdaten lassen sich aus einem 6-Band-Pan-Sharpened WorldView-2-Bild, QuickBird-, GeoEye-, Pleiades-, RapidEye- oder Landsat 8-Bild erzeugen. Diese Flexibilität ermöglicht Ihnen die einmalige Ableitung des segmentierten Rasters und Generierung der Dateien für Klassifikator-Definition und daraus resultierenden klassifizierten Feature-Karten aus einer Vielzahl von Bildquellen, je nach Ihrer Anwendung.

Segmentattribute berechnen

Bei den vorstehend beschriebenen Werkzeugen handelt es sich um die gebräuchlichsten Werkzeuge im objektorientierten Workflow. Ein weiteres Werkzeug, Segmentattribute berechnen, unterstützt Einspeisung und Export segmentierter Raster in bzw. aus Drittanwendungen. Dieses Werkzeug berechnet anhand eines segmentierten Bildes und eines zusätzlichen Rasters die Attribute jedes Segments und gibt diese Informationen in Form eines Index-Rasters mit zugeordneter Attributtabelle aus.

Zweck dieses Werkzeugs ist, eine weitere Analyse des segmentierten Rasters zu ermöglichen. Die Attribute lassen sich in einer Statistik- oder Grafikanwendung Dritter analysieren oder als Eingabe für zusätzliche Klassifikatoren, die von Esri nicht unterstützt werden, verwenden. Außerdem unterstützt dieses Werkzeug die Einspeisung eines segmentierten Rasters aus Datenpaketen Dritter, was die Anwendungsmöglichkeiten und Flexibilität von Esri erweitert, indem Daten und Anwendungspakete Dritter genutzt werden können.

Klassifizierung

Das Werkzeug Raster klassifizieren führt eine Bildklassifizierung gemäß der Esri Classifier Definition-Datei aus. In das Werkzeug eingegeben werden u. a. das zu klassifizierende Bild, das optionale zweite Raster (ein segmentiertes Raster oder ein anderer Raster-Layer, z. B. ein DEM) sowie eine Klassifikator-Definitionsdatei zum Generieren des klassifizierten Raster-Datasets. Das Werkzeug Raster klassifizieren erwartet die gleichen Eingaben wie das Trainingswerkzeug. Beachten Sie, dass das Werkzeug Raster klassifizieren alle unterstützten Klassifikatoren enthält. Die Auswahl des passenden Klassifikators erfolgt anhand der in der Datei für Klassifikator-Definition enthaltenen Eigenschaften und Informationen. Somit wird durch die Klassifikator-Definitionsdatei, die vom Werkzeug ISO-Cluster-Klassifikator trainieren, Maximum-Likelihood-Klassifikator trainieren, Support Vector Machine-Klassifikator trainieren oder Random Trees-Klassifikator trainieren generiert wird, bei Ausführung von Raster klassifizieren der entsprechende Klassifikator aktiviert.

Ausgegeben wird ein thematisch klassifiziertes Raster-Dataset, in dem die Klassen in der zugeordneten Attributtabelle identifiziert sind, und dessen Farben dem im Trainingsprozess entwickelten Schema entsprechen.

Genauigkeitsbewertung

Genauigkeitsbewertung ist ein wichtiger Teil jedes Klassifizierungsprojekts. Sie vergleicht das klassifizierte Bild mit einer anderen Datenquelle, die als genau betrachtet wird, oder mit Referenzdaten. Referenzdaten können vor Ort erfasst werden (bekannt als Überprüfungsdaten), was jedoch sehr zeit- und kostenaufwändig ist. Referenzdaten können auch aus der Interpretation hochauflösender Bilddaten, vorhandener klassifizierter Bilddaten oder GIS-Daten-Layern abgeleitet werden.

Für gewöhnlich wird die Genauigkeit einer klassifizierten Karte bewertet, indem zufällige Punkte aus den Referenzdaten erstellt und mit den klassifizierten Daten in einer Konfusionsmatrix verglichen werden. Obwohl dies in zwei Schritten erfolgt, müssen Sie die Ergebnisse verschiedener Klassifizierungsmethoden oder Trainingsgebiete vergleichen, oder Sie verfügen über keine Referenzdaten und legen dieselben Bilddaten zugrunde, anhand derer Sie die Klassifizierung erstellt haben. Um diese Workflows zu realisieren, werden bei der Genauigkeitsbewertung, die in zwei Schritten durchgeführt wird, die folgenden Werkzeuge angewendet: Punkte für Genauigkeitsbewertung erstellen, Punkte für Genauigkeitsbewertung aktualisieren und Konfusionsmatrix berechnen.

Klassifizierungsassistent

Für die Klassifizierung sind i. d. R. mehrere Schritte erforderlich: vom ordnungsgemäßen Vorverarbeiten der Bilddaten, Zuweisen der Klassenkategorien und Erstellen relevanter Trainingsdaten bis zum Ausführen der Klassifizierung sowie Bewerten und Verbessern der Genauigkeit der Ergebnisse. Der in ArcGIS Pro verfügbare Klassifizierungsassistent führt den Analysten durch den Klassifizierungs-Workflow und hilft, akzeptable Ergebnisse sicherzustellen.