Räumliche Autokorrelation (Morans I) (Spatial Statistics)

Zusammenfassung

Misst die räumliche Autokorrelation basierend auf Feature-Standorten und Attributwerten unter Verwendung von Morans I-Statistikwerten.

Weitere Informationen zur Funktionsweise der räumlichen Autokorrelation (Global Moran's I)

Abbildung

Abbildung "Global Moran's I"

Verwendung

  • Das Werkzeug Räumliche Autokorrelation gibt fünf Werte zurück: Morans I-Index, erwarteter Index, Abweichung, Z-Wert und p-Wert. Diese Werte werden während der Ausführung des Werkzeugs unten im Bereich Geoverarbeitung als Meldungen geschrieben und als abgeleitete Werte zur potenziellen Verwendung in Modellen oder Skripten übergeben. Um auf die Meldungen zuzugreifen, zeigen Sie mit der Maus auf die Fortschrittsleiste, und klicken Sie auf die Pop-out-Schaltfläche, oder erweitern Sie den Abschnitt "Details" im Bereich Geoverarbeitung. Sie können auf die Meldungen und Details eines zuvor ausgeführten Werkzeugs auch über den Geoverarbeitungsverlauf zugreifen. Optional können Sie mit diesem Werkzeug eine HTML-Berichtsdatei mit einer grafischen Zusammenfassung der Ergebnisse erstellen. Der Pfad zu dem Bericht wird in die Meldungen einbezogen, in denen die Parameter für die Werkzeugausführung zusammengefasst sind. Klicken Sie auf diesen Pfad, um die Berichtsdatei zu öffnen.

  • Mit diesem Werkzeug können Sie auswerten, ob das von einer Gruppe von Features und einem zugeordneten Attribut gebildete Muster gruppiert, verteilt oder zufällig ist. Wenn das Z-Ergebnis oder der p-Wert auf statistische Bedeutung hinweist, zeigt ein positiver Morans I-Indexwert eine Tendenz zur Cluster-Bildung und ein negativer Morans I-Indexwert eine Tendenz zur Streuung an.

  • Mit diesem Werkzeug werden ein Z-Wert und ein p-Wert berechnet, die Aufschluss darüber geben, ob Sie die NULL-Hypothese ablehnen können. In diesem Fall wird in der NULL-Hypothese davon ausgegangen, dass die Werte der Features räumlich nicht korreliert sind.
  • Die Z-Ergebnisse und p-Werte sind Werte von statistischer Bedeutung, die Aufschluss darüber geben, ob Sie die Nullhypothese ablehnen können oder nicht. Bei diesem Werkzeug wird in der Nullhypothese davon ausgegangen, dass die mit Features verknüpften Werte zufällig verteilt sind.
  • Das Eingabefeld sollte eine Vielzahl von Werten aufweisen. Für diese Statistikberechnung ist es erforderlich, dass nicht alle Variablen den gleichen Wert aufweisen; eine Berechnung ist z. B. nicht möglich, wenn alle Eingabewerte 1 lauten. Wenn Sie mit diesem Werkzeug das räumliche Muster von Ereignisdaten analysieren möchten, können Sie dazu die Ereignisdaten zusammenfassen. Optimierte Hot-Spot-Analyse kann auch zur Analyse des räumlichen Musters von Ereignisdaten verwendet werden.

    Hinweis:

    Ereignisdaten sind Punkte, die Ereignisse (Verbrechen, Verkehrsunfälle) oder Objekte (Bäume, Geschäfte) darstellen, wobei der Fokus auf der An- oder Abwesenheit und nicht auf ein mit einem Punkt verknüpften gemessenen Attribut liegt.

  • Wenn die Eingabe-Feature-Class nicht projiziert ist (d. h., wenn Koordinaten in Grad, Minuten und Sekunden angegeben werden) oder als Ausgabe-Koordinatensystem ein geographisches Koordinatensystem festgelegt wurde, werden Entfernungen mit Sehnenmesswerten berechnet. Sehnenentfernungsmesswerte werden verwendet, weil sie schnell berechnet werden können und ausgezeichnete Schätzung von echten geodätischen Entfernungen zulassen, zumindest für Punkte innerhalb von 30 Grad voneinander. Sehnenentfernungen basieren auf einem abgeplatteten Sphäroid. Im Fall von zwei beliebigen Punkten auf der Erdoberfläche ist die Sehnenentfernung zwischen diesen die Länge einer Linie, die durch die dreidimensionale Erde führt, um diese beiden Punkte zu verbinden. Sehnenentfernungen werden in Metern angegeben.

    Vorsicht:

    Achten Sie darauf, Ihre Daten zu projizieren, wenn sich der Untersuchungsbereich über 30 Grad hinaus erstreckt. Sehnenentfernungen erlauben keine sichere Schätzung von geodätischen Entfernungen über 30 Grad hinaus.

  • Wenn in der Analyse Sehnenentfernungen verwendet werden, sollte der Parameter Entfernungsband oder Entfernungsschwellenwert (falls angegeben) in Metern angegeben werden.

  • Für Linien- und Polygon-Features werden bei Entfernungsberechnungen Feature-Schwerpunkte verwendet. Für Multipoints, Polylinien oder Polygone mit mehreren Teilen wird der Schwerpunkt mithilfe des gewichteten arithmetischen Mittelpunkts aller Feature-Teile berechnet. Die Gewichtung für Punkt-Features ist 1, für Linien-Features "Länge" und für Polygon-Features "Fläche".

  • Der Parameterwert Konzeptualisierung von räumlichen Beziehungen sollte inhärente Beziehungen unter den Features, die analysiert werden, widerspiegeln. Je realistischer Sie modellieren können, wie Features im Raum interagieren, desto genauer werden die Ergebnisse. Empfehlungen werden unter Auswählen einer Konzeptualisierung räumlicher Beziehungen: Empfehlungen beschrieben. Weitere Tipps:

    • Festes Entfernungsband

      Mit dem Standardwert des Parameters Entfernungsband oder Entfernungsschwellenwert wird sichergestellt, dass jedes Feature mindestens einen Nachbarn hat. Das ist wichtig, jedoch ist dieser Standardwert häufig nicht die am besten geeignete Entfernung für die Analyse. Zusätzliche Strategien, mit deren Hilfe Sie einen geeigneten Maßstab (ein Entfernungsband) für die Analyse ermitteln können, werden unter Entfernungsband (Einflusszone) dargestellt.

    • Inverse Entfernung oder Inverse Entfernung im Quadrat

      Wird für den Parameter Entfernungsband oder Entfernungsschwellenwert 0 eingegeben, werden alle Features als Nachbarn aller anderen Features betrachtet. Wenn dieser Parameter leer bleibt, wird die Standardentfernung angewendet.

      Gewichtungen für Entfernungen von weniger als 1 werden instabil, wenn sie umgekehrt werden. Demzufolge wird der Gewichtung für Features, deren Entfernung weniger als 1 Entfernungseinheit beträgt, ein Wert von 1 zugewiesen.

      Bei den Optionen für die inverse Entfernung (Inverse Entfernung, Inverse Entfernung im Quadrat und Indifferenzzone) wird allen lagegleichen Punkten eine Gewichtung von 1 zugewiesen, um eine Nulldivision zu vermeiden. Damit wird sichergestellt, dass keine Features aus der Analyse ausgeschlossen werden.

    • FIXED_DISTANCE_BAND

      Mit dem Standardwert des Parameters Entfernungsband oder Entfernungsschwellenwert wird sichergestellt, dass jedes Feature mindestens einen Nachbarn hat. Das ist wichtig, jedoch ist dieser Standardwert häufig nicht die am besten geeignete Entfernung für die Analyse. Zusätzliche Strategien, mit deren Hilfe Sie einen geeigneten Maßstab (ein Entfernungsband) für die Analyse ermitteln können, werden unter Entfernungsband oder Entfernungsschwellenwert dargestellt.

    • INVERSE_DISTANCE oder INVERSE_DISTANCE_SQUARED

      Wird für den Parameter Entfernungsband oder Entfernungsschwellenwert 0 eingegeben, werden alle Features als Nachbarn aller anderen Features betrachtet. Wenn dieser Parameter leer bleibt, wird die Standardentfernung angewendet.

      Gewichtungen für Entfernungen von weniger als 1 werden instabil, wenn sie umgekehrt werden. Demzufolge wird der Gewichtung für Features, deren Entfernung weniger als 1 Entfernungseinheit beträgt, ein Wert von 1 zugewiesen.

      Bei den Optionen für inverse Entfernung (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED und ZONE_OF_INDIFFERENCE) wird allen lagegleichen Punkten eine Gewichtung von 1 zugewiesen, um eine Nulldivision zu vermeiden. Damit wird sichergestellt, dass keine Features aus der Analyse ausgeschlossen werden.

  • In Python enthält die abgeleitete Ausgabe dieses Werkzeugs den Morans I-Indexwert, den Z-Wert den p-Wert und eine HTML-Berichtsdatei. Wenn Sie beispielsweise das Result-Objekt des Werkzeugs einer Variablen namens MoranResult zuweisen, dann speichert MoranResult[0] den Morans I-Indexwert, MoranResult[1] speichert den Z-Wert, MoranResult[2] speichert den p-Wert, und MoranResult[3] speichert den Dateipfad der HTML-Berichtsdatei. Wenn Sie keine HTML-Berichtsdatei mit dem Parameter Bericht erstellen ausgeben, ist die letzte abgeleitete Ausgabe eine leere Zeichenfolge.

  • Zusätzliche Optionen für den Parameter Konzeptualisierung von räumlichen Beziehungen, einschließlich dreidimensionaler und Raum-Zeit-Beziehungen, sind über das Werkzeug Räumliche Gewichtungsmatrix erstellen verfügbar. Um diese zusätzlichen Optionen zu nutzen, konstruieren Sie eine Datei mit der räumlichen Gewichtungsmatrix vor der Analyse. Wählen Sie Räumliche Gewichtungen aus Datei übernehmen als Parameter Konzeptualisierung von räumlichen Beziehungen aus und geben Sie für den Parameter Gewichtungsmatrix-Datei den Pfad zur erstellten Datei mit der räumlichen Gewichtung an.

  • Sie können Karten-Layer verwenden, um die Eingabe-Feature-Class zu definieren. Beim Verwenden eines Layers mit einer Auswahl sind nur die ausgewählten Features in der Analyse enthalten.

  • Wenn Sie eine Gewichtungsmatrix-Datei mit einer .swm-Erweiterung bereitstellen, wird von diesem Werkzeug eine Datei mit räumlicher Gewichtungsmatrix erwartet, die mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen erstellt wird; andernfalls wird von diesem Werkzeug eine Datei mit der räumlichen Gewichtungsmatrix im ASCII-Format erwartet. Das Verhalten variiert in Abhängigkeit davon, welche Art von Datei mit der räumlichen Gewichtungsmatrix Sie verwenden:

    • Dateien mit der räumlichen Gewichtungsmatrix im ASCII-Format:
      • Gewichtungen werden unverändert verwendet. Fehlende Feature-zu-Feature-Beziehungen werden als Nullen behandelt.
      • Wenn die Gewichtungen zeilenstandardisiert sind, sind die Ergebnisse für Analysen von Auswahlsätzen mit hoher Wahrscheinlichkeit fehlerhaft. Wenn Sie die Analyse für einen Auswahlsatz ausführen müssen, konvertieren Sie die ASCII-Datei mit den räumlichen Gewichtungen in eine SWM-Datei, indem Sie die ASCII-Daten in eine Tabelle einlesen und dann die Option Tabelle konvertieren mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen verwenden.
    • SWM-formatierte Matrixdatei für räumliche Gewichtung:
      • Wenn die Gewichtungen reihenstandardisiert sind, werden sie für die Auswahlsätze erneut reihenstandardisiert; ansonsten werden die Gewichtungen unverändert verwendet.

  • Das Ausführen der Analyse mit einer Datei mit der räumlichen Gewichtungsmatrix im ASCII-Format erfordert mehr Arbeitsspeicher. Ziehen Sie bei Analysen für mehr als 5.000 Features die Konvertierung Ihrer ASCII-formatierten räumlichen Gewichtungsmatrix-Datei in eine SWM-formatierte Datei in Betracht. Fügen Sie als Erstes die ASCII-Gewichtungen in eine formatierte Tabelle ein (z. B. eine Excel-Tabelle). Führen Sie als Nächstes das Werkzeug Räumliche Gewichtungsmatrix erstellen mit der Option Tabelle konvertieren für den Parameter Konzeptualisierung von räumlichen Beziehungen aus. Die Ausgabe ist eine SWM-formatierte Datei mit räumlicher Gewichtungsmatrix.

  • Hinweis:

    Wenn Sie dieses Werkzeug ausführen, ist möglicherweise nicht genügend Speicherplatz verfügbar. Dieser Fall tritt gewöhnlich auf, wenn Sie Konzeptualisierung von räumlichen Beziehungen und Entfernungsband oder Entfernungsschwellenwert auswählen. Das Ergebnis sind Features mit sehr vielen Nachbarn. In der Regel empfiehlt es sich nicht, räumliche Beziehungen so zu definieren, dass Features Tausende von Nachbarn aufweisen. Alle Features sollten mindestens einen Nachbarn und fast alle Features mindestens acht Nachbarn aufweisen.

  • Für Polygon-Features sollten Sie in der Regel immer die Option Zeile für den Parameter Standardisierung auswählen. Die Reihen-Standardisierung verringert die Verzerrung, wenn die Anzahl der Nachbarn der einzelnen Features eine Funktion des Aggregationsschemas oder Sampling-Prozesses ist, und die tatsächliche räumliche Verteilung der analysierten Variable nicht widergespiegelt wird.

  • Das Hilfethema Modellierungen räumlicher Beziehungen enthält weitere Informationen zu den Parametern dieses Werkzeugs.

  • Vorsicht:

    Denken Sie beim Verwenden von Shapefiles daran, dass diese keine NULL-Werte speichern können. Werkzeuge oder andere Verfahren zur Erstellung von Shapefiles aus Nicht-Shapefile-Eingaben speichern oder interpretieren NULL-Werte möglicherweise als Wert 0. In manchen Fällen werden NULL-Werte in Shapefiles als sehr große negative Werte gespeichert. Dies kann zu unerwarteten Ergebnissen führen. Weitere Informationen finden Sie unter Überlegungen zur Geoverarbeitung für die Shapefile-Ausgabe.

Syntax

arcpy.stats.SpatialAutocorrelation(Input_Feature_Class, Input_Field, {Generate_Report}, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Weights_Matrix_File}, {number_of_neighbors})
ParameterErklärungDatentyp
Input_Feature_Class

Die Feature-Class, für die die räumliche Autokorrelation berechnet wird.

Feature Layer
Input_Field

Das numerische Feld, das beim Bewerten der räumlichen Autokorrelation verwendet wird.

Field
Generate_Report
(optional)
  • NO_REPORTEs wird keine grafische Zusammenfassung erstellt. Dies ist die Standardeinstellung.
  • GENERATE_REPORTEs wird eine grafische Zusammenfassung als HTML-Datei erstellt.
Boolean
Conceptualization_of_Spatial_Relationships

Gibt an, wie räumliche Beziehungen zwischen Features definiert werden.

  • INVERSE_DISTANCENahe gelegene benachbarte Features haben einen größeren Einfluss auf die Berechnungen für ein Ziel-Feature als Features, die weiter weg liegen.
  • INVERSE_DISTANCE_SQUAREDEntspricht INVERSE_DISTANCE, aber aufgrund einer stärkeren Neigung fällt der Einfluss schneller ab. Nur die Nachbarn in direkter Nähe eines Ziel-Features haben dann merklichen Einfluss auf die Berechnungen für dieses Feature.
  • FIXED_DISTANCE_BANDJedes Feature wird im Kontext benachbarter Features analysiert. Benachbarte Features innerhalb der angegebenen kritischen Entfernung (Distance_Band_or_Threshold) erhalten eine Gewichtung von 1 und beeinflussen die Berechnungen für das Ziel-Feature. Benachbarte Features außerhalb der kritischen Entfernung erhalten eine Gewichtung von 0 und haben keinen Einfluss auf die Berechnungen eines Ziel-Features.
  • ZONE_OF_INDIFFERENCEFeatures innerhalb der angegebenen kritischen Entfernung (Distance_Band_or_Threshold) eines Ziel-Feature erhalten eine Gewichtung von 1 und beeinflussen die Berechnungen für das Feature. Sobald die kritische Entfernung überschritten wird, nimmt die Gewichtung (und somit der Einfluss eines benachbarten Features auf die Berechnung von Ziel-Features) mit der Entfernung ab.
  • K_NEAREST_NEIGHBORSDie nächstgelegenen k Features werden in die Analyse einbezogen. Die Anzahl der Nachbarn (k), die in die Analyse einbezogen werden sollen, wird durch den Parameter number_of_neighbors angegeben.
  • CONTIGUITY_EDGES_ONLYNur benachbarte Polygon-Features mit einer gemeinsamen Grenze oder mit einer Überlappung beeinflussen Berechnungen für das Ziel-Polygon-Feature.
  • CONTIGUITY_EDGES_CORNERSPolygon-Features mit einer gemeinsamen Grenze, einem gemeinsamen Knoten oder mit einer Überlappung beeinflussen Berechnungen für das Zielpolygon-Feature.
  • GET_SPATIAL_WEIGHTS_FROM_FILERäumliche Beziehungen werden durch eine Datei mit räumlichen Gewichtungen definiert. Der Pfad zur Datei mit räumlichen Gewichtungen wird durch den Parameter Weights_Matrix_File angegeben.
String
Distance_Method

Gibt an, wie Entfernungen von den einzelnen Features zu benachbarten Features berechnet werden.

  • EUCLIDEAN_DISTANCEEs wird die geradlinige Entfernung zwischen zwei Punkten (die als Luftlinie gemessene Entfernung) verwendet.
  • MANHATTAN_DISTANCEEs wird die Entfernung zwischen zwei Punkten, die entlang von rechtwinkligen Achsen gemessen werden (Gebäudeblock), verwendet. Für die Berechnung werden die (absoluten) Differenzen zwischen den X- und Y-Koordinaten berechnet.
String
Standardization

Gibt an, ob die Standardisierung räumlicher Gewichtungen angewendet wird. Eine Reihen-Standardisierung wird immer dann empfohlen, wenn die Verteilung der Features aufgrund einer Referenzpunkterfassung oder eines auferlegten Zusammenfassungsschemas möglicherweise verzerrt ist.

  • NONEEs wird keine Standardisierung räumlicher Gewichtungen angewendet.
  • ROWRäumliche Gewichtungen werden standardisiert. Jede Gewichtung wird durch ihre eigene Reihensumme (die Summe der Gewichtungen aller benachbarten Features) dividiert. Dies ist die Standardeinstellung.
String
Distance_Band_or_Threshold_Distance
(optional)

Der Entfernungsgrenzwert für die verschiedenen Optionen mit inverser Entfernung und mit fester Entfernung. Features außerhalb des angegebenen Grenzwerts für ein Ziel-Feature werden in Analysen für dieses Feature ignoriert. Mit der ZONE_OF_INDIFFERENCE wird jedoch der Einfluss von Features außerhalb der angegebenen Entfernung in Abhängigkeit der Entfernung reduziert, während die Features innerhalb des Entfernungsschwellenwerts gleichmäßig berücksichtigt werden. Der eingegebene Entfernungswert sollte dem Ausgabekoordinatensystem entsprechen.

Bei Konzeptualisierungen von räumlichen Beziehungen mit inverser Entfernung gibt der Wert 0 an, dass keine Schwellenwertentfernung angewendet wird. Wenn dieser Parameter leer gelassen wird, wird ein Standardschwellenwert berechnet und angewendet. Dieser Standardwert ist die euklidische Entfernung, bei der sichergestellt wird, dass jedes Feature mindestens einen Nachbarn hat.

Dieser Parameter hat keine Auswirkungen, wenn räumliche Konzeptualisierungen vom Typ "Polygonnachbarschaft" (CONTIGUITY_EDGES_ONLY oder CONTIGUITY_EDGES_CORNERS) oder GET_SPATIAL_WEIGHTS_FROM_FILE ausgewählt werden.

Double
Weights_Matrix_File
(optional)

Der Pfad zu einer Datei mit Gewichtungen, die räumliche und potenziell zeitliche Beziehungen unter Features definieren.

File
number_of_neighbors
(optional)

Eine ganze Zahl, mit der die Anzahl der Nachbarn angegeben wird, die in die Analyse einbezogen werden.

Long

Abgeleitete Ausgabe

NameErklärungDatentyp
Index

Der Morans-Indexwert.

Double
ZScore

Der Z-Wert.

Double
PValue

Der p-Wert.

Double
Report_File

Eine HTML-Datei mit einer grafischen Ergebnisübersicht.

Datei

Codebeispiel

SpatialAutocorrelation – Beispiel 1 (Python-Fenster)

Das folgende Skript veranschaulicht die Verwendung des Werkzeugs SpatialAutocorrelation im Python-Fenster.

import arcpy
arcpy.env.workspace = r"c:\data"
arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual","NO_REPORT", 
                                   "GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN DISTANCE", 
                                   "NONE", "#","euclidean6Neighs.swm")
SpatialAutocorrelation – Beispiel 2 (eigenständiges Skript)

Das folgende eigenständige Python-Skript veranschaulicht, wie Sie das Werkzeug SpatialAutocorrelation verwenden.

# Analyze the growth of regional per capita incomes in US
# Counties from 1969 -- 2002 using Ordinary Least Squares Regression
# Import system modules
import arcpy
# Set property to overwrite existing outputs
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\Data"
try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace
    # Growth as a function of {log of starting income, dummy for South
    # counties, interaction term for South counties, population density}
    # Process: Ordinary Least Squares... 
    ols = arcpy.OrdinaryLeastSquares_stats("USCounties.shp", "MYID", 
                        "olsResults.shp", "GROWTH",
                        "LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69",
                        "olsCoefTab.dbf",
                        "olsDiagTab.dbf")
    # Create Spatial Weights Matrix (Can be based off input or output FC)
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.GenerateSpatialWeightsMatrix_stats("USCounties.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6) 
                        
    # Calculate Moran's I Index of Spatial Autocorrelation for 
    # OLS Residuals using a SWM File.  
    # Process: Spatial Autocorrelation (Morans I)...      
    moransI = arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual",
                        "NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE", 
                        "EUCLIDEAN_DISTANCE", "NONE", "#", 
                        "euclidean6Neighs.swm")
except:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Umgebungen

Ausgabe-Koordinatensystem

Die Feature-Geometrie wird vor der Analyse auf das Ausgabe-Koordinatensystem projiziert. Alle mathematischen Berechnungen basieren auf dem Raumbezug des Ausgabe-Koordinatensystems. Wenn das Ausgabekoordinatensystem auf Grad, Minuten und Sekunden basiert, werden geodätische Entfernungen mithilfe von Sehnenentfernungen geschätzt.

Lizenzinformationen

  • Basic: Ja
  • Standard: Ja
  • Advanced: Ja

Verwandte Themen