Moran-Eigenvektoren

Viele Werkzeuge in der Toolbox "Spatial Statistics" erfordern die Definition einer Nachbarschaft (oder Konzeptualisierung von räumlichen Beziehungen), die definiert, welche Features Nachbarn voneinander sind, und jedem Paar zweier Nachbarn eine Gewichtung zuweist. Die Nachbarn und Gewichtungen definieren zusammen eine räumliche Gewichtungsmatrix (Spatial Weights Matrix, SWM, eigtl: Matrix räumlicher Gewichtungen), die die räumlichen Beziehungen zwischen allen Paaren zweier Features darstellen. Bei N Features enthält die SWM N Zeilen und N Spalten (eine quadratische Matrix), in der die Zeilen das erste Feature des Paares und die Spalten das zweite Feature des Paares darstellen und der entsprechende Wert in der Matrix die Gewichtung (oder Beziehung) zwischen dem Paar darstellt. Wenn zum Beispiel eine Polygonnachbarschaft verwendet wird, dann ist für jeweils zwei Polygone in der entsprechenden Zelle der Wert 1 enthalten, wenn sie miteinander verbunden sind, und der Wert 0 enthalten, wenn sie nicht miteinander verbunden sind.

Jede quadratische, symmetrische Matrix kann basierend auf Eigenvektoren und Eigenwerten in N unabhängige (unkorrelierte) Komponenten zerlegt werden, und jede Komponente stellt einen unabhängigen Faktor der Ursprungsmatrix dar (ähnlich dessen, wie die Hauptkomponentenanalyse bestimmte Variablen in unkorrelierte Komponenten refaktoriert). Diese Komponenten enthalten alle Informationen der Ursprungsmatrix, sind aber refaktoriert und so separiert, dass sie einzeln untersucht werden können, wobei sich oft Kernstrukturen, die innerhalb der Ursprungsmatrix verborgen sind, offenbaren. Wenn die Matrix eine SWM ist, dann werden diese Eigenvektoren als Moran-Eigenvektoren (oder auch als räumliche Komponenten) bezeichnet und stellen räumliche Kernmuster der Features und der SWM dar.

Jeder Moran-Eigenvektor weist jedem Feature einen numerischen Wert zu, und da sie in der Regel kartiert und symbolisiert sind, um die räumlichen Muster zu visualisieren, werden sie häufig als Moran-Eigenvektorkarten (Moran Eigenvector Maps, MEMs) bezeichnet. Die ersten MEMs (die mit den größten Eigenwerten und stärksten Mustern) entsprechen in der Regel breiten, globalen räumlichen Mustern, wie zum Beispiel einem Nord-Süd- oder Ost-West-Trend, und spätere MEMs (die mit den kleineren Eigenwerten und schwächeren Mustern) stellen in der Regel lokalere räumliche Muster dar. Die folgende Abbildung zeigt zum Beispiel verschiedene MEMs für ein Mosaik aus Hexagonen mit Polygonnachbarschaft zum Definieren der SWM. Die oberste Zeile enthält die ersten vier MEMs, die breitere räumliche Muster darstellen, und die unterste Zeile enthält vier spätere MEMs, deren Muster lokaler sind.

Acht MEMs für dieselben Features und dieselbe SWM

Es ist wichtig zu beachten, dass bei der Erstellung von MEMs nur die SWM und die Positionen der Features, aber kein Feld und keine Variable dieser Features verwendet werden. Dadurch entsprechen die räumlichen Muster möglicherweise keiner Variablen, die an diesen Positionen vorhanden ist. Sie stellen stattdessen potenzielle räumliche Muster dar, die so kombiniert werden können, dass verschiedene räumliche Muster räumlicher Variablen dargestellt werden können. Wenn ein Feld der Features beispielsweise einen deutlichen Trend von Westen nach Osten aufweist, darüber hinaus jedoch auch kleine Cluster mit niedrigen und hohen Werten enthält, dann kann das räumliche Muster dieser einen Variablen durch die Kombination von zwei MEMs dargestellt werden: Eine für den Trend von Westen nach Osten und eine andere für die Cluster. Bei komplizierteren räumlichen Variablen können viele verschiedene MEMs erforderlich sein, damit ihr räumliches Muster angemessen dargestellt werden kann.

Es besteht auch eine enge Beziehung zwischen einer MEM und der Morans I-Statistik, die den Grad des räumlichen Clusterings (Autokorrelation) einer räumlichen Variablen misst. Die erste MEM ist die Gruppe der Werte der Features, die zum größtmöglichen Morans I-Wert (größtmögliche räumliche Autokorrelation) führt. Die zweite MEM ist die Gruppe der Werte, die zum größtmöglichen Morans I-Wert führt, wenn die Werte mit den Werten der ersten MEM unkorreliert sein müssen. Die dritte MEM ist die Gruppe der Werte, die zum größtmöglichen Morans I-Wert führt, wenn sie mit jeder der ersten zwei MEMs unkorreliert sein muss, und so weiter. Für N Features können bis zu N MEMs erstellt werden, obwohl in der Regel weniger als 25 Prozent der MEMs nützliche räumliche Muster darstellen.

Der Morans I-Wert der ersten MEM ist der größtmögliche Morans I-Wert für jedes Feld der Features. Mit anderen Worten: Wenn sich auch nur ein einziger Wert bei einem einzigen Feature ändern würde, dann nähme der Morans I-Wert ab, und die Variable wäre weniger gruppiert (geclustert). Dies ermöglicht Ihnen das Kontextualisieren der Morans I-Werte Ihrer tatsächlichen Daten. Eine häufige Fehlannahme besteht darin, dass der größtmögliche Morans I-Wert für jedes Dataset und jede SWM gleich 1 ist. Häufig ist aber je nach den Features und der SWM der größtmögliche Morans I-Wert wesentlich kleiner als 1 (oft etwa 0,6). Es ist auch möglich, dass der größte Morans I-Wert größer als 1,0 ist, dies ist aber selten der Fall. Wenn zum Beispiel für ein Feld Ihrer Daten der Morans I-Wert gleich 0,65 ist, dann erscheint dies möglicherweise nicht sehr hoch, wenn Sie davon ausgehen, dass der größtmögliche Wert gleich 1 ist. Wenn aber die erste MEM einen Morans I-Wert gleich 0,7 hat, dann heißt das, dass dieses Feld nahezu die größtmögliche räumliche Autokorrelation für Ihre SWM aufweist. Dies hilft Ihnen auch dabei, eine geeignete SWM für Ihre Analyse auszuwählen, da bei einigen SWMs wesentlich größere Morans I-Werte möglich sind als bei anderen.

Möglichkeiten der Verwendung von MEMs in der räumlichen Analyse

Für MEMs gibt es verschiedenste Möglichkeiten der Verwendung in der räumlichen Analyse, und die Werkzeuge im Toolset "Dienstprogramme für räumliche Komponenten (Moran-Eigenvektoren) erstellen und verwenden MEMs auf verschiedene Art und Weise:

  • Räumliche Struktur zerlegen (Moran-Eigenvektoren): Erstellt die MEMs mit dem höchsten Morans I-Wert für die Eingabe-Feature-Class und die SWM. Die Eingabe ist eine Feature-Class, und die SWM wird über Nachbarschaftsparameter definiert. Wie viele MEMs erstellt werden sollen, können Sie durch Angabe eines relativen Schwellenwertes für Morans I und einer maximalen Anzahl von MEMs steuern. Die Ausgabe ist eine Feature-Class mit denselben Features wie die Eingabe, in der die MEMs als Felder enthalten sind. Die durch das Werkzeug erstellten MEMs können auf einer Karte dargestellt werden, um die verschiedenen räumlichen Muster der SWM zu visualisieren und den maximalen Morans I-Wert eines Feldes der Features für die SWM zu bewerten.

  • Konzeptualisierungen von Nachbarschaften vergleichen: Schlägt ein Nachbarschafts- und Gewichtungsschema vor, das die räumlichen Muster von Feldern einer Feature-Class am genauesten darstellt. Die Eingabe ist eine Feature-Class und mindestens ein Feld. Die Ausgabe ist eine SWM-Datei, die in anderen Werkzeugen in der Toolbox "Spatial Statistics", die es ermöglichen, benutzerdefinierte SWM-Dateien zum Definieren von Nachbarn und Gewichtungen zu verwenden, verwendet werden können, wie zum Beispiel die Werkzeuge Bivariate räumliche Zuordnung (Lee's L), Hot-Spot-Analyse (Getis-Ord Gi*) und Cluster- und Ausreißeranalyse (Anselin Local Morans I). Dieses Werkzeug bestimmt die vorgeschlagene SWM, indem es ermittelt, welche SWM MEMs erstellt, die den räumlichen Mustern der Eingabefelder am meisten ähneln.

  • Erklärende Variablen für räumliche Komponenten erstellen: Erstellt die MEMs, die die räumlichen Muster mehrerer Felder einer Eingabe-Feature-Class am besten darstellen oder erklären, und wählt sie aus. Dies ist nützlich, wenn Sie ein Modell, wie zum Beispiel ein Regressionsmodell des Typs "Kleinste Quadrate (Ordinary Least Squares, OLS)", erstellen möchten und dabei die räumlichen Muster der Variablen berücksichtigt werden sollen. Sie können die Feature-Class und alle (erklärenden und abhängigen) Variablen im Werkzeug angeben, und das Werkzeug erstellt dann MEMs, die für die Darstellung der räumlichen Muster der Eingabefelder nützlich sind. Durch die Einbeziehung dieser MEMs als erklärende Variablen (zusätzlich zu den ursprünglichen erklärenden Variablen) in das Vorhersagemodell lässt sich das Modell generell verbessern, da durch die Berücksichtigung der räumlichen Muster der Variablen bessere Schätzungen der Koeffizienten der ursprünglichen erklärenden Variablen bereitgestellt werden und die Genauigkeit der Vorhersagen verbessert wird.

  • Räumliche Autokorrelation aus Feld filtern: Erstellt die MEMs, die die Autokorrelation eines Eingabefeldes am besten beseitigen und eine räumlich gefilterte Version des Eingabefeldes generieren, und wählt sie aus. Dabei wird das Eingabefeld in räumliche Komponenten (die MEMs) und eine nichträumliche Komponente (die räumlich gefilterte Version des Eingabefeldes) aufgeteilt. Das gefilterte Feld behält die statistischen Kerneigenschaften des Feldes bei, während räumliche Effekte, wie zum Beispiel Trends und Cluster, ausgeklammert werden. Das gefilterte Feld kann anschließend in Korrelations-Workflows oder sonstigen Analysen verwendet werden, in denen die Auswirkung des Raumes unerwünscht ist und zusätzliches Rauschen im zugrunde liegenden Signal des Feldes erzeugt. Zum Beispiel können Sie die Korrelation zwischen Luftverschmutzung und Asthma-Raten schätzen und dabei die räumlichen Effekte, die mit beiden Variablen verbunden sind, ausklammern, um die direkte Korrelation oder Beziehung zwischen diesen zwei Variablen zu isolieren. Wenn es sich beim Eingabefeld um ein Feld mit Residuen aus einem Vorhersagemodell handelt, dann können die ausgewählten MEMs als erklärende Variablen des Vorhersagemodells (zusätzlich zu den ursprünglichen erklärenden Variablen) verwendet werden, um die räumliche Autokorrelation des Residuenterms des Modells zu beseitigen. Dies ist nützlich, da eine Annahme vieler Vorhersagemodelle darin besteht, dass die Residuen nicht räumlich autokorreliert sind.

Weitere Informationen

MEMs werden nur dann erstellt oder ausgewählt, wenn sie eine positive räumliche Autokorrelation aufweisen, was bedeutet, dass die Muster nicht gestreute Muster, sondern räumliche Cluster darstellen.

Die Anzahl der erstellten MEMs entspricht in diesem Fall der Anzahl der Eingabe-Features bis zu maximal 100. Die Werkzeuge Erklärende Variablen für räumliche Komponenten erstellen und Räumliche Autokorrelation aus Feld filtern wählen dann unter diesen MEMs aus, um am effektivsten erklärende Variablen erstellen bzw. die räumliche Autokorrelation filtern zu können.

Mit Ausnahme des Werkzeugs Räumliche Struktur zerlegen (Moran-Eigenvektoren) (das ein einzelnes angegebenes Nachbarschafts- und Gewichtungsschema verwendet), testen die Werkzeuge 28 verschiedene SWMs und verwenden dann die SWM, die MEMs erstellt, die für den Zweck des Werkzeugs am effektivsten sind. Die folgenden SWMs werden getestet:

  • Fünf Entfernungsbänder, jeweils mit ungewichtetem, Gauß- und Biquadrat-Kernel (insgesamt 15). Das kürzeste Entfernungsband ist die Entfernung, bei der jedes Feature mindestens einen Nachbarn hat. Das längste Entfernungsband umfasst 20 Prozent der diagonalen Ausdehnung der Eingabe-Features. Die anderen drei Entfernungsbänder werden durch gleichmäßiges Inkrementieren zwischen dem kürzesten und dem längsten Entfernungsband erstellt. Bei Polygon-Features wird zur Bestimmung der Entfernungen und Nachbarn die Entfernung zwischen Schwerpunkten verwendet.
  • Vier unterschiedliche Werte für die Anzahl der Nachbarn (8, 16, 32 und 64), jeweils mit ungewichtetem, Gauß- und Biquadrat-Kernel (insgesamt 12). Die Bandbreiten sind adaptiv und entsprechen bei K Nachbarn der Entfernung zum Nachbarn (k+1). Wenn weniger als K Eingabe-Features vorhanden sind, dann wird jede größere Anzahl der Nachbarn übersprungen. Wenn zum Beispiel 50 K Eingabe-Features vorhanden sind, dann werden die drei SWMs mit 64 nächsten Nachbarn übersprungen. Bei Polygon-Features wird zur Bestimmung der Entfernungen und Nachbarn die Entfernung zwischen Schwerpunkten verwendet.
  • Bei Punkt-Features ist die endgültige SWM eine Nachbarschaft des Typs "Delaunay-Triangulation". Bei Polygon-Features ist die endgültige SWM eine Nachbarschaft des Typs "Benachbarte Kanten/Ecken".

Weitere Informationen zu den einzelnen Nachbarschaften und zur Kernel-Gewichtung finden Sie unter Funktionsweise des Werkzeugs "Nachbarschaftssummenstatistik" und Modellierung von räumlichen Beziehungen. Sie können aber auch eine benutzerdefinierte .swm-Datei im Parameter Eingabe-Datei der räumlichen Gewichtungsmatrix angeben. Wenn eine .swm-Datei angegeben wurde, dann wird diese Datei zum Erstellen und Auswählen der MEMs verwendet, und die obigen 28 SWMs werden nicht getestet.

Vor dem Berechnen der MEMs wird jede SWM so angepasst, dass die Summe in jeder Zeile und Spalte gleich 0 ist (als doppeltes Zentrieren bezeichnet). Wenn die SWM nicht symmetrisch ist, zum Beispiel bei Verwendung einer Nachbarschaft des Typs "Anzahl der Nachbarn", dann wird die SWM vor dem doppelten Zentrieren zu ihrer transponierten Matrix addiert, um Symmetrie herzustellen.

Referenzen

Bei der Implementierung der Werkzeuge wurden folgende Ressourcen verwendet:

  • Bauman, David; Drouet, Thomas; Dray, Stéphane und Vleminckx, Jason. 2018. "Disentangling good from bad practices in the selection of spatial or phylogenetic eigenvectors." Ecography 41.10: 1638–1649. https://doi.org/10.1111/ecog.03380.

  • Bauman, David; Drouet, Thomas; Fortin, Marie-Josée und Dray, Stéphane. 2018. "Optimizing the choice of a spatial weighting matrix in eigenvector-based methods." Ecology 99, Nr. 10: 2159–2166. https://doi.org/10.1002/ecy.2469.

  • Blanchet, F. Guillaume; Legendre, Pierre und Borcard, Daniel. 2008. "Forward selection of explanatory variables." Ecology 89, Nr. 9: 2623–2632. https://doi.org/10.1890/07-0986.1.

  • Dray, Stéphane; Bauman, David; Blanchet, Guillaume; Borcard, Daniel; Clappe, Sylvie; Guenard, Guillaume; Jombart, Thibaut; Larocque, Guillaume; Legendre, Pierre; Madi, Naima und Wagner, Helene H. 2022. "adespatial: Multivariate Multiscale Spatial Analysis." R-Paketversion 0.3-16. https://CRAN.R-project.org/package=adespatial.

  • Griffith, Daniel A. 2003. "Spatial Autocorrelation and Spatial Filtering." Advances in Spatial Science. Springer. ISBN 978-3-540-24806-4. https://doi.org/10.1007/978-3-540-24806-4.

  • Griffith, Daniel A. und Peres-Neto, Pedro R. 2006. "Spatial modeling in ecology: the flexibility of eigenfunction spatial analyses." Ecology 87, Nr. 10: 2603–2613. https://doi.org/10.1890/0012-9658(2006)87[2603:SMIETF]2.0.CO;2.

Verwandte Themen