Funktionsweise von räumlicher Autokorrelation (Global Moran's I)

Das Werkzeug Räumliche Autokorrelation (Morans I) misst räumliche Autokorrelation basierend auf Feature-Positionen und Feature-Werten gleichzeitig. Es wertet aus, ob das von einer Gruppe von Features und einem zugeordneten Attribut gebildete Muster gruppiert, verteilt oder zufällig ist. Das Werkzeug berechnet den Morans I-Indexwert und ein Z-Wert und einen p-Wert, um die Signifikanz dieses Indexes auszuwerten. P-Werte sind numerische Annäherungen der Fläche unter der Kurve für eine bekannte Verteilung, die durch die Teststatistik begrenzt ist.

Berechnungen

Zum Berechnen von Global Moran's I verwendete Mathematik

Anzeigen zusätzlicher Mathematik für Global Moran's I

Die Mathematik hinter der Global Moran's I-Statistik wird oben angezeigt. Das Werkzeug berechnet den Mittelwert und die Abweichung für das Attribut, das ausgewertet wird. Anschließend subtrahiert es für jeden Feature-Wert den Mittelwert, wodurch eine Abweichung vom Mittelwert erstellt wird. Abweichungswerte für alle benachbarten Features (beispielsweise Features innerhalb des angegebenen Entfernungsbandes) werden multipliziert, um ein Kreuzprodukt zu erstellen. Beachten Sie, dass der Zähler der Global Moran's I-Statistik diese summierten Kreuzprodukte umfasst. Angenommen, Feature A und B sind Nachbarn und der Mittelwert für alle Feature-Werte ist 10. Beachten Sie den Bereich möglicher Ergebnisse für Kreuzprodukt:

Feature-Werte

Abweichungen

Kreuzprodukte

A=50

B=40

40

30

1200

A= 8

B=6

-2

-4

8

A=20

B=2

10

-8

-80

Wenn beide Werte für benachbarte Features größer oder beide kleiner sind als der Mittelwert, ist das Kreuzprodukt positiv. Wenn ein Wert kleiner und der andere größer ist als der Mittelwert, ist das Kreuzprodukt negativ. In allen Fällen gilt, je größer die Abweichung vom Mittelwert, desto größer das Kreuzproduktergebnis. Wenn die Werte im Dataset zu räumlicher Cluster-Bildung tendieren (hohe Werte bilden Cluster in der Nähe von anderen hohen Werten; niedrige Werte bilden Cluster in der Nähe von anderen niedrigen Werten), ist der Moran's Index positiv. Wenn hohe Werte andere hohe Werte ablehnen und häufig nahe bei niedrigen Werten liegen, ist der Index negativ. Wenn positive und negative Kreuzproduktwerte ausgeglichen sind, hat der Index einen Wert nahe Null. Der Zähler wird durch die Abweichung normalisiert, sodass die Indexwerte zwischen -1.0 und +1.0 fallen (weitere Informationen zu Ausnahmen finden Sie im Abschnitt "FAQ" unten).

Nachdem das Werkzeug Räumliche Autokorrelation (Morans I) den Indexwert berechnet hat, wird der Wert "Erwarteter Index" berechnet. Anschließend werden die Werte "Erwarteter Index" und "Beobachteter Index" verglichen. Das Werkzeug berechnet ausgehend von der Anzahl der Features im Dataset und der Abweichung für die Datenwerte insgesamt einen Z-Wert und einen p-Wert, die angeben, ob dieser Unterschied statistisch signifikant ist. Indexwerte können nicht direkt, sondern lediglich im Kontext der Null-Hypothese interpretiert werden.

Interpretation

Das Werkzeug Räumliche Autokorrelation (Morans I) ist eine schlussfolgernde Statistik, d. h. die Ergebnisse der Analyse werden immer im Kontext der Null-Hypothese interpretiert. Bei der Global Moran's I-Statistik gibt die Null-Hypothese an, dass das analysierte Attribut zufällig auf die Features im Untersuchungsgebiet verteilt wird; anders ausgedrückt, die räumlichen Prozesse, die das beobachtete Wertemuster fördern, sind zufällig. Angenommen, Sie können die Werte für das analysierte Attribut aufnehmen, sie auf die Features werfen und dabei jeden Wert beliebig fallen lassen. Dieser Vorgang (Aufnehmen und Abwerfen der Werte) ist ein Beispiel für einen zufälligen räumlichen Prozess.

Wenn der von diesem Werkzeug zurückgegebene p-Wert statistisch signifikant ist, können Sie die Null-Hypothese ablehnen. In der nachstehenden Tabelle wird die Interpretation der Ergebnisse zusammengefasst:

Der p-Wert ist nicht statistisch signifikant.

Die Null-Hypothese kann nicht abgelehnt werden. Es ist gut möglich, dass die räumliche Verteilung der Feature-Werte das Ergebnis zufälliger räumlicher Prozesse ist. Das beobachtete räumliche Muster von Feature-Werten könnte eine von vielen, vielen möglichen Versionen der zufälligen räumlichen Verteilung (Complete Spatial Randomness, CSR) sein.

Der p-Wert ist statistisch signifikant und der Z-Wert ist positiv.

Die Null-Hypothese kann abgelehnt werden. Die räumliche Verteilung von hohen und/oder niedrigen Werten im Dataset weist größere räumliche Gruppierungen auf als erwartet würden, wenn die unterliegenden räumlichen Prozesse zufällig wären.

Der p-Wert ist statistisch signifikant und der Z-Wert ist negativ.

Die Null-Hypothese kann abgelehnt werden. Die räumliche Verteilung von hohen und niedrigen Werten im Dataset weist eine größere räumliche Verteilung auf als erwartet würde, wenn die unterliegenden räumlichen Prozesse zufällig wären. Ein verteiltes räumliches Muster gibt häufig eine Art von Mitbewerbsprozess wieder: ein Feature mit hohen Werten lehnt andere Features mit hohen Werten häufig ab; entsprechend lehnt ein Feature mit einem niedrigen Wert andere Features mit niedrigen Werten ab.

Hinweis:

Die Null-Hypothese ist sowohl für das Werkzeug Clustering von hohen/niedrigen Werten (General G) als auch für das Werkzeug Räumliche Autokorrelation (Global Moran's I) eine zufällige räumliche Verteilung. Das Werkzeug Interpretation von Z-Werten für das Clustering von hohen/niedrigen Werten (General G) ist jedoch anders.

Ausgabe

Das Werkzeug Räumliche Autokorrelation gibt fünf Werte zurück: Morans I-Index, erwarteter Index, Abweichung, Z-Wert und p-Wert. Diese Werte werden während der Ausführung des Werkzeugs unten im Bereich Geoverarbeitung als Meldungen geschrieben und als abgeleitete Werte zur potenziellen Verwendung in Modellen oder Skripten übergeben. Sie können auf die Meldungen zugreifen, indem Sie mit der Maus auf die Fortschrittsleiste zeigen, auf die Pop-out-Schaltfläche klicken oder den Abschnitt "Meldungen" im Bereich Geoverarbeitung erweitern. Sie können auch auf die Meldungen für ein zuvor ausgeführtes Werkzeug über den Geoverarbeitungsverlauf zugreifen. Optional erstellt dieses Werkzeug eine HTML-Berichtsdatei mit einer grafischen Zusammenfassung der Ergebnisse. Der Pfad zu dem Bericht wird in die Meldungen einbezogen, in denen die Parameter für die Werkzeugausführung zusammengefasst sind. Durch Klicken auf diesen Pfad wird die Berichtsdatei geöffnet.

Richtlinien für bewährte Methoden

  • Enthält die Eingabe-Feature-Class mindestens 30 Features? Bei weniger als 30 Features sind die Ergebnisse nicht zuverlässig.
  • Ist die ausgewählte Konzeptualisierung von räumlichen Beziehungen geeignet? Weitere Informationen finden Sie unter Auswählen einer Konzeptualisierung räumlicher Beziehungen.
  • Ist das Entfernungsband oder der Entfernungsschwellenwert geeignet? Weitere Informationen finden Sie unter Auswählen eines Wertes für ein festes Entfernungsband.
    • Jedes Feature sollte mindestens einen Nachbarn aufweisen.
    • Kein Feature sollte alle anderen Features als Nachbarn haben.
    • Besonders wenn die Werte für das Eingabefeld verzerrt sind, sollten die Features über jeweils ca. acht Nachbarn verfügen.
  • Sollten Sie die Reihen-Standardisierung verwenden? Für Polygon-Features verwenden Sie fast immer die Reihen-Standardisierung. Weitere Informationen finden Sie unter Standardisierung.

FAQs

F: Ergebnisse des Werkzeugs Hot-Spot-Analyse (Getis-Ord Gi*) geben statistisch signifikante Hot-Spots an. Warum sind die Ergebnisse des Werkzeugs Räumliche Autokorrelation (Global Moran's I) nicht ebenfalls statistisch signifikant?

A: Globale Statistiken wie das Werkzeug Räumliche Autokorrelation (Global Moran's I) bewerten das Muster und den Trend der Daten insgesamt. Sie sind am effektivsten, wenn das räumliche Muster im gesamten Untersuchungsgebiet konsistent ist. Lokale Statistiken (wie die Hot-Spot-Analyse (Getis-Ord Gi*)) bewerten jedes Feature im Kontext benachbarter Features und vergleichen die lokale Situation mit der globalen Situation. Sehen Sie sich das folgende Beispiel an. Wenn Sie einen Mittelwert oder Durchschnitt für eine Gruppe von Werten berechnen, wird gleichzeitig eine globale Statistik berechnet. Wenn alle Werte nahe 20 liegen, liegt der Mittelwert ebenfalls nahe 20, wobei dieses Ergebnis insgesamt eine sehr gute Repräsentation/Zusammenfassung des Datasets ist. Wenn die eine Hälfte der Werte jedoch nahe 1 und die andere Hälfte der Werte nahe 100 liegt, liegt der Mittelwert nahe 50. Da möglicherweise keine Datenwerte nahe 50 vorhanden sind, ist der Mittelwert insgesamt keine gute Repräsentation/Zusammenfassung des Datasets. Wenn Sie ein Histogramm der Datenwerte erstellen, wird die bimodale Verteilung angezeigt. Entsprechend sind globale räumliche Statistiken, einschließlich des Werkzeugs Räumliche Autokorrelation (Global Moran's I) am effektivsten, wenn die gemessenen räumlichen Prozesse im gesamten Untersuchungsgebiet konsistent sind. Die Ergebnisse sind dann eine gute Repräsentation/Zusammenfassung des räumlichen Musters insgesamt. Weitere Informationen und die Analyse der dargestellten SIDs finden Sie in den unten aufgeführten Quellen zu Getis and Ord (1992).

 

F: Warum unterscheiden sich die Ergebnisse des Werkzeugs Clustering von hohen/niedrigen Werten (Getis-Ord General G) von den Ergebnissen des Werkzeugs Räumliche Autokorrelation (Morans I)?

A: Diese Werkzeuge messen unterschiedliche räumliche Muster. Klicken Sie hier, um weitere Informationen zu erhalten.

 

F:: Können Sie die Z-Werte oder p-Werte dieses Werkzeugs mit den Ergebnissen von Analysen für andere Untersuchungsgebiete vergleichen?

A: Ergebnisse können nicht für verschiedene Untersuchungsgebiete verglichen werden. Wenn das Untersuchungsgebiet festgelegt ist, kann (beispielsweise werden alle Analysen für Landkreise von Kalifornien durchgeführt) das Eingabefeld verglichen werden (beispielsweise umfassen alle Analysen einen Typ von Bevölkerungsanzahl), und wenn die Werkzeugparameter identisch sind (z. B. feste Entfernung mit einem Entfernungsband oder einem Entfernungsschwellenwert von 5000 Metern und Reihen-Standardisierung), können Sie statistisch signifikante Z-Werte vergleichen, um einen Eindruck von der Intensität räumlicher Cluster-Bildung oder räumlicher Verteilung zu erhalten oder Trends im Zeitverlauf besser zu verstehen. Sie können die Analyse auch für eine Reihe von steigenden Entfernungsband- oder Entfernungsschwellenwerten ausführen, um die Entfernungen/Maßstäbe zu ermitteln, bei denen die Prozesse, die die räumliche Cluster-Bildung fördern, am auffälligsten sind.

 

F: Warum erhalte ich einen Moran's Index von größer als 1,0 oder kleiner als -1,0?

A: Der Global Moran's Index ist im Allgemeinen durch den Bereich -1,0 bis 1,0 begrenzt. Dies ist immer dann der Fall, wenn Ihre Gewichtungen reihenstandardisiert sind. Wenn Sie die Gewichtungen nicht reihenstandardisieren, können Fälle auftreten, in denen der Indexwert außerhalb des Bereichs -1,0 bis 1,0 liegt, was auf ein Problem bei den Parametereinstellungen hinweist. Die folgenden Probleme treten am häufigsten auf:

  • Das Eingabefeld ist stark verzerrt (erstellen Sie ein Histogramm der Datenwerte, um dies anzuzeigen) und die Konzeptualisierung von räumlichen Beziehungen oder das Entfernungsband ist so gestaltet, dass einige Features nur sehr wenige Nachbarn aufweisen. Die Global Moran's I-Statistik ist asymptotisch normal, d. h. bei verzerrten Daten sollte jedes Feature mindestens acht Nachbarn aufweisen. Der für den Parameter Entfernungsband oder Entfernungsschwellenwert berechnete Standardwert stellt sicher, dass jedes Feature mindestens einen Nachbarn hat, dies aber möglicherweise insbesondere dann nicht ausreichend ist, wenn Werte im Eingabefeld stark verzerrt sind.
  • Es wird eine Konzeptualisierung von räumlichen Beziehungen für inverse Entfernungen verwendet und die inversen Entfernungen sind sehr klein.
  • Reihen-Standardisierung ist nicht ausgewählt, sollte es aber sein. Beim Aggregieren der Daten sollten Sie Reihen-Standardisierung auswählen, es sei denn das Aggregationsschema bezieht sich direkt auf das analysierte Feld.

Potenzielle Anwendungsbereiche

  • Bessere Identifizierung einer geeigneten Nachbarschaftsentfernung für eine Reihe von räumlichen Analysemethoden durch Ermitteln der Entfernung, bei der die Autokorrelation am stärksten ist.
  • Messen genereller Trends bei der Trennung von ethnischen Gruppen im Zeitverlauf – nimmt Rassentrennung zu oder ab?
  • Zusammenfassen der Verbreitung einer Idee oder Krankheit oder der Trend im räumlichen und Zeitverlauf – bleiben Idee, Krankheit oder Trend isoliert und konzentriert oder verteilen sie sich und werden diffuser?

Zusätzliche Quellen

Die folgenden Bücher und Artikel von Fachzeitschriften enthalten weitere Informationen zu diesem Werkzeug:

Getis, Arthur, and J. K. Ord. "The Analysis of Spatial Association by Use of Distance Statistics." Geographical Analysis 24, no. 3. 1992.

Goodchild, Michael F. Spatial Autocorrelation. Catmog 47, Geo Books. 1986.

Griffith, Daniel. Spatial Autocorrelation: A Primer. Resource Publications in Geography, Association of American Geographers. 1987.

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.