Das Werkzeug Räumliche Autokorrelation (Global Moran's I) misst die räumliche Autokorrelation basierend auf Feature-Positionen und Feature-Werten gleichzeitig. Es wertet aus, ob das von einer Gruppe von Features und einem zugeordneten Attribut gebildete Muster gruppiert, verteilt oder zufällig ist. Das Werkzeug berechnet den Moran's I-Indexwert und einen Z-Wert und einen p-Wert, um die Signifikanz dieses Indexes auszuwerten. P-Werte sind numerische Annäherungen der Fläche unter der Kurve für eine bekannte Verteilung, die durch die Teststatistik begrenzt ist.
Berechnungen
Anzeigen zusätzlicher Mathematik für Global Moran's I
Die Berechnungen hinter der Global Moran's I-Statistik werden oben angezeigt. Das Werkzeug berechnet den Mittelwert und die Abweichung für das Attribut, das ausgewertet wird. Anschließend subtrahiert es für jeden Feature-Wert den Mittelwert, wodurch eine Abweichung vom Mittelwert erstellt wird. Abweichungswerte für alle benachbarten Features (beispielsweise Features innerhalb des angegebenen Entfernungsbandes) werden multipliziert, um ein Kreuzprodukt zu erstellen. Der Zähler der Global Moran's I-Statistik umfasst diese summierten Kreuzprodukte. Angenommen, Feature A und B sind Nachbarn und der Mittelwert für alle Feature-Werte ist 10. Der Bereich möglicher Ergebnisse für Kreuzprodukte ist wie folgt:
Feature-Werte | Abweichungen | Kreuzprodukte | |||
---|---|---|---|---|---|
A=50 | B=40 | 40 | 30 | 1200 | |
A=8 | B=6 | -2 | -4 | 8 | |
A=20 | B=2 | 10 | -8 | -80 |
Wenn beide Werte für benachbarte Features größer oder beide kleiner sind als der Mittelwert, ist das Kreuzprodukt positiv. Wenn ein Wert kleiner und der andere größer ist als der Mittelwert, ist das Kreuzprodukt negativ. In allen Fällen gilt, je größer die Abweichung vom Mittelwert, desto größer das Kreuzproduktergebnis. Wenn die Werte im Dataset zu räumlicher Cluster-Bildung tendieren (hohe Werte bilden Cluster in der Nähe von anderen hohen Werten; niedrige Werte bilden Cluster in der Nähe von anderen niedrigen Werten), ist der Moran's Index positiv. Wenn hohe Werte andere hohe Werte abstoßen und häufig nahe bei niedrigen Werten liegen, ist der Index negativ. Wenn positive und negative Kreuzproduktwerte ausgeglichen sind, hat der Index einen Wert nahe Null. Der Zähler wird durch die Abweichung normalisiert, sodass die Indexwerte zwischen -1.0 und +1.0 fallen (weitere Informationen zu Ausnahmen finden Sie im Abschnitt "Weitere Informationen" unten).
Nachdem das Werkzeug den Indexwert berechnet hat, wird der Wert "Erwarteter Index" berechnet. Anschließend werden die Werte "Erwarteter Index" und "Beobachteter Index" verglichen. Das Werkzeug berechnet ausgehend von der Anzahl der Features im Dataset und der Abweichung für die Datenwerte insgesamt einen Z-Wert und einen p-Wert, die angeben, ob dieser Unterschied statistisch signifikant ist. Indexwerte können nicht direkt, sondern lediglich im Kontext der NULL-Hypothese interpretiert werden.
Interpretation
Das Werkzeug ist eine schließende Statistik, d. h. die Ergebnisse der Analyse werden immer im Kontext der NULL-Hypothese interpretiert. Bei der Global Moran's I-Statistik gibt die NULL-Hypothese an, dass das analysierte Attribut zufällig auf die Features im Untersuchungsgebiet verteilt ist; die räumlichen Prozesse, die zum beobachteten Wertemuster führen, sind zufällig. Angenommen, Sie können die Werte für das analysierte Attribut aufnehmen, sie auf die Features werfen und dabei jeden Wert beliebig fallen lassen. Dieser Vorgang (Aufnehmen und Abwerfen der Werte) ist ein Beispiel für einen zufälligen räumlichen Prozess.
Wenn der von diesem Werkzeug zurückgegebene p-Wert statistisch signifikant ist, können Sie die NULL-Hypothese ablehnen. In der nachstehenden Tabelle wird die Interpretation der Ergebnisse zusammengefasst:
Der p-Wert ist nicht statistisch signifikant. | Die NULL-Hypothese kann nicht abgelehnt werden. Es ist gut möglich, dass die räumliche Verteilung der Feature-Werte das Ergebnis zufälliger räumlicher Prozesse ist. Das beobachtete räumliche Muster von Feature-Werten könnte eine von vielen, vielen möglichen Versionen der zufälligen räumlichen Verteilung (Complete Spatial Randomness, CSR) sein. |
Der p-Wert ist statistisch signifikant und der Z-Wert ist positiv. | Die NULL-Hypothese kann abgelehnt werden. Die räumliche Verteilung von hohen und/oder niedrigen Werten im Dataset weist größere räumliche Gruppierungen auf als erwartet würden, wenn die unterliegenden räumlichen Prozesse zufällig wären. |
Der p-Wert ist statistisch signifikant und der Z-Wert ist negativ. | Die NULL-Hypothese kann abgelehnt werden. Die räumliche Verteilung von hohen und niedrigen Werten im Dataset weist eine größere räumliche Verteilung auf als erwartet würde, wenn die unterliegenden räumlichen Prozesse zufällig wären. Ein verteiltes räumliches Muster gibt häufig eine Art von Mitbewerbsprozess wieder: ein Feature mit hohen Werten lehnt andere Features mit hohen Werten häufig ab; entsprechend lehnt ein Feature mit einem niedrigen Wert andere Features mit niedrigen Werten ab. |
Hinweis:
Die NULL-Hypothese ist sowohl für das Werkzeug Clustering von hohen/niedrigen Werten (General G) als auch für das Werkzeug Räumliche Autokorrelation (Global Moran's I) eine zufällige räumliche Verteilung. Das Werkzeug Interpretation von Z-Werten für das Clustering von hohen/niedrigen Werten (General G) ist jedoch anders.
Ausgabe
Das Werkzeug Räumliche Autokorrelation gibt fünf Werte zurück: Morans I-Index, erwarteter Index, Abweichung, Z-Wert und p-Wert. Das Werkzeug stellt diese Werte als Geoverarbeitungsmeldungen und als abgeleitete Ausgabewerte zur Verwendung in Modellen oder Skripten bereit. Optional erstellt dieses Werkzeug eine .html-Datei mit einer grafischen Zusammenfassung der Ergebnisse. Der Pfad zu dem Bericht ist in den Meldungen zu sehen, in denen die Parameter für das Werkzeug zusammengefasst sind. Klicken Sie auf diesen Pfad, um die Berichtsdatei zu öffnen.
Empfehlungen
Beim Verwenden dieses Werkzeugs sollten Sie die folgenden Hinweise beachten:
- Die Eingabe-Feature-Class sollte mindestens 30 Features enthalten. Bei weniger als 30 Features sind die Ergebnisse nicht zuverlässig.
- Der angegebene Parameterwert für die Konzeptualisierung von räumlichen Beziehungen muss geeignet sein.
- Der angegebene Parameterwert Entfernungsband oder Entfernungsschwellenwert muss geeignet sein. Folgendes muss zutreffen:
- Jedes Feature sollte mindestens einen Nachbarn aufweisen.
- Kein Feature sollte alle anderen Features als Nachbarn haben.
- Wenn die Werte für den Parameterwert Eingabefeld verzerrt sind, sollte jedes Feature etwa acht Nachbarn haben.
- Für Eingabe-Polygon-Features sollten Sie fast immer die Standardisierung verwenden.
Weitere Informationen
Ergebnisse des Werkzeugs Hot-Spot-Analyse (Getis-Ord Gi*) geben statistisch signifikante Hot-Spots an. Die Ergebnisse des Werkzeugs sind möglicherweise nicht statistisch signifikant. Globale Statistiken vom Werkzeug Räumliche Autokorrelation (Global Moran's I) bewerten das Muster und den Trend der Daten insgesamt. Sie sind am effektivsten, wenn das räumliche Muster im gesamten Untersuchungsgebiet konsistent ist. Lokale Statistiken (wie vom Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*)) bewerten jedes Feature im Kontext benachbarter Features und vergleichen die lokale Situation mit der globalen Situation. Sehen Sie sich das folgende Beispiel an. Wenn Sie einen Mittelwert oder Durchschnitt für eine Gruppe von Werten berechnen, wird gleichzeitig eine globale Statistik berechnet. Wenn alle Werte nahe 20 liegen, liegt der Mittelwert ebenfalls nahe 20, wobei dieses Ergebnis insgesamt eine sehr gute Repräsentation und Zusammenfassung des Datasets ist. Wenn die eine Hälfte der Werte jedoch nahe 1 und die andere Hälfte der Werte nahe 100 liegt, liegt der Mittelwert nahe 50. Da möglicherweise keine Datenwerte nahe 50 vorhanden sind, ist der Mittelwert insgesamt keine gute Repräsentation oder Zusammenfassung des Datasets. Wenn Sie ein Histogramm der Datenwerte erstellen, wird die bimodale Verteilung angezeigt. Entsprechend sind globale räumliche Statistiken, einschließlich des Werkzeugs Räumliche Autokorrelation (Global Moran's I) am effektivsten, wenn die gemessenen räumlichen Prozesse im gesamten Untersuchungsgebiet konsistent sind. Die Ergebnisse sind dann eine gute Repräsentation und Zusammenfassung des räumlichen Musters insgesamt. Weitere Informationen finden Sie unter The Analysis of Spatial Association by Use of Distance Statistics und in der Analyse der SIDs.
Die Ergebnisse dieses Werkzeugs unterscheiden sich von den Ergebnissen des Werkzeugs Räumliche Autokorrelation (Global Moran's I). Diese beiden Werkzeuge messen unterschiedliche räumliche Muster. Weitere Informationen finden Sie unter Clustering von hohen/niedrigen Werten (Getis-Ord General G).
Ergebnisse von Z-Werten oder p-Werten unterschiedlicher Untersuchungsgebiete können nicht verglichen werden. Wenn das Untersuchungsgebiet festgelegt ist (beispielsweise werden alle Analysen für Landkreise von Kalifornien durchgeführt), der Parameterwert Eingabefeld vergleichbar ist (beispielsweise umfassen alle Analysen einen Typ von Bevölkerungsanzahl) und die Werkzeugparameter identisch sind, können Sie statistisch signifikante Z-Werte vergleichen, um einen Eindruck von der Intensität räumlicher Cluster-Bildung oder räumlicher Verteilung zu erhalten oder Trends im Zeitverlauf besser zu verstehen. Sie können die Analyse auch für eine Reihe von steigenden Parametwerten unter Entfernungsband- oder Entfernungsschwellenwert ausführen, um die Entfernungen/Maßstäbe zu ermitteln, bei denen die Prozesse, die zur räumlichen Cluster-Bildung führen, am auffälligsten sind.
Der Global Moran's-Index ist im Allgemeinen durch den Bereich -1,0 bis 1,0 begrenzt. Dies ist immer dann der Fall, wenn Ihre Gewichtungen zeilenstandardisiert sind. Wenn Sie die Gewichtungen nicht zeilenstandardisieren, können Fälle auftreten, in denen der Indexwert außerhalb des Bereichs -1,0 bis 1,0 liegt, was auf ein Problem bei den Parametereinstellungen hinweist. Die folgenden Probleme treten am häufigsten auf:
- Der Parameterwert Eingabefeld ist stark verzerrt (erstellen Sie ein Histogramm der Datenwerte, um dies anzuzeigen) und der Parameterwert Konzeptualisierung von räumlichen Beziehungen oder Entfernungsband ist so gestaltet, dass einige Features nur sehr wenige Nachbarn aufweisen. Die Global Moran's I-Statistik ist asymptotisch normal, d. h. bei verzerrten Daten sollte jedes Feature mindestens acht Nachbarn aufweisen. Der für den Parameter Entfernungsband oder Entfernungsschwellenwert berechnete Standardwert stellt sicher, dass jedes Feature mindestens einen Nachbarn hat, dies kann aber möglicherweise insbesondere dann nicht ausreichend sein, wenn Werte im Parameter Eingabefeld stark verzerrt sind.
- Wenn die Option Inverse Entfernung des Parameters Konzeptualisierung von räumlichen Beziehungen verwendet wird, sind die inversen Entfernungen sehr klein.
- Der Parameter Standardisierung ist nicht auf die Option Zeile eingestellt, sollte es aber sein. Wenn Daten aggregiert wurden, sollten Sie die Option Zeile auswählen, es sei denn, das Aggregationsschema bezieht sich direkt auf das analysierte Feld.
Beispielanwendungen
Im Folgenden werden beispielhaft einige Anwendungsbereiche des Werkzeugs vorgestellt:
- Identifizierung einer geeigneten Nachbarschaftsentfernung für eine Reihe von räumlichen Analysemethoden durch Ermitteln der Entfernung, bei der die räumliche Autokorrelation am stärksten ist.
- Messen genereller Trends bei der Trennung von ethnischen Gruppen im Zeitverlauf – nimmt Rassentrennung zu oder ab?
- Zusammenfassen der Verbreitung einer Idee oder Krankheit oder der Trend im räumlichen und Zeitverlauf – bleiben Idee, Krankheit oder Trend isoliert und konzentriert oder verteilen sie sich und werden diffuser?
Zusätzliche Quellen
Die folgenden Bücher und Artikel von Fachzeitschriften enthalten weitere Informationen zu diesem Werkzeug:
Getis, Arthur, and J. K. Ord. "The Analysis of Spatial Association by Use of Distance Statistics." Geographical Analysis 24, no. 3. 1992.
Goodchild, Michael F. Spatial Autocorrelation. Catmog 47, Geo Books. 1986.
Griffith, Daniel. Spatial Autocorrelation: A Primer. Resource Publications in Geography, Association of American Geographers. 1987
The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.