Mit der Image Analyst-Lizenz verfügbar.
Die Hauptkomponentenanalyse (PCA) ist eine klassische Technik der explorativen Datenanalyse. Sie wird häufig verwendet, um die Dataset-Dimensionalität zu reduzieren, damit Merkmale und Muster der Daten erkennbar werden. In der multivariaten Analyse kann die PCA beispielsweise verwendet werden, um zu identifizieren, welche Variablen erforderlich sind und welche Variablen ohne Einfluss auf das Analyseergebnis ausgeschlossen werden können. In der multispektralen und hyperspektralen Bildanalyse kann das Werkzeug Multidimensionale Hauptkomponenten verwendet werden, um eine Reihe von Hauptkomponenten mit dem größten Informationsgehalt zu berechnen, sodass die Analyse an einer geringeren Anzahl an Bändern durchgeführt werden kann. Bild-Zeitseriendaten sind häufiger geworden. Sie sind jedoch mit Herausforderungen im Hinblick auf die Identifizierung und Extraktion von Zielinformationen verbunden. Bei diesem Werkzeug wird die PCA-Technik zum Analysieren von Zeitseriendaten oder multidimensionalen Raster-Daten verwendet.
Hauptkomponentenanalyse multidimensionaler Raster-Daten
Ein multidimensionales Raster enthält eine oder mehrere Variablen. Mit dem Werkzeug Multidimensionale Hauptkomponenten wird jeweils eine Variable analysiert (3D-Bilddatenwürfel mit den Dimensionen X, Y, Zeit oder X, X, Z). Der Bilddatenwürfel wird unter Maximierung der Varianz in eine Reihe von Hauptkomponenten transformiert, sodass Merkmale und Muster in den Daten identifiziert und extrahiert werden können. Ein Bilddatenwürfel kann auf zwei Arten betrachtet werden: als ein Satz Bilder (Ausschnitte), die jeweils einen Bildzeitpunkt repräsentieren, oder als ein Satz eindimensionaler Arrays, die jeweils eine Pixel-Zeitserie (zeitliches Profil) repräsentieren. Im folgenden Beispiel werden Bild-Zeitseriendaten verwendet, um die Funktionalität zu beschreiben. Dabei wird vorausgesetzt, dass das Werkzeug auch auf Daten mit einer nicht zeitlichen Dimension angewendet werden kann:
Die Hauptkomponentenanalyse kann mit dem Modus "Dimensionsreduktion" und dem Modus "Räumliche Reduktion" angewendet werden. Die Verarbeitung mit diesen beiden Modi beinhaltet zwei unterschiedliche Anwendungen.
- Im Modus "Dimensionsreduktion" werden die Daten als ein Satz von Bildern analysiert. Dabei werden die Daten in einen Satz von Bildern, in dem die bestimmenden Features und Muster erfasst sind, transformiert und reduziert. Sie können beispielsweise in einer Bild-Zeitserie vorherrschende Wasserpixel extrahieren und die Veränderungen des Gewässers im zeitlichen Verlauf abbilden. Der Modus "Dimensionsreduktion" wird häufig in Bild-Zeitserienanalysen von Landdaten verwendet, beispielsweise in einer NDVI-Zeitserie.
- Im Modus "Räumliche Reduktion" werden die Daten als ein Satz von Pixel-Zeitserien analysiert. Dabei werden die bestimmenden zeitlichen Muster und die entsprechenden räumlichen Positionen der zeitlichen Muster ermittelt. Sie können beispielsweise das interanuelle zeitliche Muster von El-Niño- und La-Niña-Ereignissen anhand von Daten zur Meeresoberflächentemperatur und deren Positionen extrahieren. Dies ist für die Analyse langer Zeitserien, nicht jedoch für Daten mit hoher Auflösung geeignet.
Beispiel für das Werkzeug "Multidimensionale Hauptkomponenten"
Die Bild-Zeitserie im Beispiel unten enthält die Anzahl k der Bilder X1, X2, …, Xk, und die berechnete Hauptkomponente ist eine wie folgt ausgedrückte lineare Kombination der Bilder:
PC1 = a11X1 + a12X2 + … + a1kXk
Die entsprechende Matrixform für alle Hauptkomponenten lautet:
Y = XA
Dabei gilt:
Y = (PC1, PC2, …, PCk)
ist die Matrix, die die Hauptkomponenten enthält, undX = (X1, X2, …, Xk)
ist die Matrix, die die Eingabedaten enthält.Matrix A enthält Koeffizienten, mit denen die Originaldaten in die Hauptkomponenten transformiert werden. Die Werte von Matrix A werden als Ladungen bezeichnet, die beschreiben, wie stark jedes Bild zu einer bestimmten Hauptkomponente beiträgt. Eine große Ladung gibt an, dass das Bild eine starke Beziehung zu einer bestimmten Hauptkomponente aufweist. Das Vorzeichen einer Ladung zeigt an, ob ein Bild und eine Hauptkomponente positiv oder negativ korreliert sind.
Die normalisierten Spalten in Matrix A sind Eigenvektoren. Sie geben die Ausrichtungen von Hauptkomponenten relativ zu den Originalbildnern an. Eigenwerte, die zusammen mit Eigenvektoren berechnet werden, geben die durch die jeweiligen Hauptkomponenten erklärten Varianzen an. Absteigend der Größe nach geordnete Eigenwerte bestimmen die Reihenfolge der Hauptkomponenten.
Die erste Komponente wird so berechnet, dass sie die größtmögliche Varianz in den Daten berücksichtigt, die zweite Komponente berücksichtigt die nächsthöhere Varianz unter der Bedingung, dass diese von der ersten Komponente dekorreliert (senkrecht) ist, und so weiter. Dies wird fortgesetzt, bis sämtliche angegebenen Komponenten berechnet wurden. Wenn alle Hauptkomponenten berechnet werden, bleiben sämtliche in den Originaldaten vorhandenden Informationen erhalten.
Weitere Informationen finden Sie unter Introduction to Principal Component Analysis (PCA).
Näheres finden Sie im Abschnitt zum Werkzeug Multidimensionale Hauptkomponenten.