Bivariate räumliche Zuordnung (Lee's L) (Spatial Statistics)

Zusammenfassung

Berechnet die räumliche Zuordnung zwischen zwei kontinuierlichen Variablen unter Verwendung der Lee's L-Statistik.

Die Lee's L-Statistik charakterisiert sowohl den Korrelationsgrad als auch den Copatterning-Grad (Ähnlichkeit des räumlichen Clustering) zwischen den Variablen. Der Wert liegt zwischen -1 und 1 und ähnelt konzeptionell einem Korrelationskoeffizienten, wird aber angepasst, um die räumliche Autokorrelation der beiden Variablen zu berücksichtigen. Lee's L-Werte nahe 1 deuten darauf hin, dass die Variablen in hohem Maße positiv korreliert sind und dass jede Variable eine hohe räumliche Autokorrelation aufweist (hohe und niedrige Werte der Variablen neigen jeweils zur Cluster-Bildung). Werte nahe -1 deuten darauf hin, dass die Variablen in hohem Maße negativ korreliert sind und dass jede Variable eine hohe positive räumliche Autokorrelation aufweist. Werte nahe 0 weisen darauf hin, dass die Variablen nicht korrelieren und/oder nicht räumlich autokorrelieren.

Die Lee's L-Statistik kann auf jedes Eingabe-Feature partitioniert werden (auch lokale Lee's L-Statistik genannt), die die lokale räumliche Zuordnung des Features und seiner Nachbarn zeigt. Damit lassen sich Bereiche ermitteln, die eine höhere oder niedrigere räumliche Zuordnung aufweisen als die globale Lee's L-Statistik. Die lokale Statistik kann auch in eine von mehreren Kategorien klassifiziert werden, die auf den Werten der Nachbarn der einzelnen Features basieren. Sowohl die globalen als auch die lokalen Statistiken werden mithilfe von Permutationen auf statistische Signifikanz getestet.

Weitere Informationen zur Funktionsweise von "Bivariate räumliche Zuordnung (Lee's L)"

Abbildung

Abbildung des Werkzeugs "Bivariate räumliche Zuordnung (Lee's L)"
Die beiden Variablen in der obersten Zeile weisen eine positive räumliche Zuordnung auf, die beiden Variablen in der untersten Zeile eine negative räumliche Zuordnung.

Verwendung

  • Die beiden Analysevariablen müssen kontinuierlich sein (nicht binär oder kategorial), und die Variablen sollten eine lineare Beziehung aufweisen. Wenn die Beziehung nicht linear ist, verwenden Sie das Werkzeug Feld transformieren, um Transformationen auf die Analysevariablen anzuwenden, mit denen die Beziehung zwischen ihnen linear wird, und führen Sie das Werkzeug mit den transformierten Werten erneut aus.

  • Das Werkzeug erzeugt eine Vielzahl von Ausgaben, mit denen Sie die räumliche Zuordnung zwischen den beiden Analysevariablen untersuchen können. Die Geoverarbeitungsmeldungen zeigen die Lee's L-Statistik und den p-Wert an, und die Ausgabe-Feature-Class enthält Felder, in denen die lokale Lee's L-Statistik, die p-Werte und die Ergebnisse der statistischen Signifikanz zusammengefasst sind. Bei der Ausführung in einer aktiven Karte wird der Ausgabe-Feature-Layer auf der Grundlage der folgenden lokalen Kategorien für die räumliche Zuordnung gezeichnet: Not Significant, High-High, Low-Low, High-Low und Low-High. Wenn beispielsweise die lokale Lee's L-Statistik zu mindestens 90 Prozent statistisch signifikant ist, die erste Analysevariable über dem Mittelwert liegt, und die zweite Variable unter dem Mittelwert liegt, lautet die Kategorie High-Low.

    Weitere Informationen zu den Ausgaben dieses Werkzeugs

  • Die p-Werte zum Testen der globalen und lokalen räumlichen Zuordnungen auf statistische Signifikanz werden anhand von Permutationen berechnet.

  • Verwenden Sie mindestens 50 Eingabe-Features, und beziehen Sie für jedes Feature mindestens 8 Nachbarn ein.

  • Die Nachbarschaften der einzelnen Features enthalten grundsätzlich auch das Feature. Wenn eine Datei mit räumlicher Gewichtung zur Definition von Nachbarn verwendet wird, wird für die Gewichtung eines Features in Bezug auf sich selbst eine Gewichtung von 1 definiert, auch wenn in der Datei mit räumlicher Gewichtung keine Gewichtung definiert ist. Die Gewichtungen jeder Nachbarschaft sind nach Zeile standardisiert, sodass sie sich zu 1 summieren.

  • Die Umgebung des Zufallszahlengenerators kann verwendet werden, um die Permutationen und p-Werte zu reproduzieren. Wenn kein Startwert angegeben wird, können sich die globalen und lokalen p-Werte aufgrund der Willkürlichkeit ändern. Wenn jedoch der Faktor für die parallele Verarbeitung auf einen Wert größer als 1 (Standardeinstellung) festgelegt wird, sind die Permutationen nicht konsistent, selbst wenn der Zufallszahlengenerator einen festen Startwert hat.

  • Wenn Sie die Reihenfolge der beiden Analysevariablen umkehren, ändert sich die globale oder lokale Lee's L-Statistik nicht, aber die p-Werte können sich aufgrund der Willkürlichkeit der Permutationen ändern. Die Kategorien High-Low und Low-High werden ebenfalls umgekehrt.

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Features

Die Eingabe-Features enthalten die Felder der beiden Analysevariablen.

Feature Layer
Analysefeld 1

Das Feld der ersten Analysevariablen. Das Feld muss numerisch sein.

Field
Analysefeld 2

Das Feld der zweiten Analysevariablen. Das Feld muss numerisch sein.

Field
Ausgabe-Features

Die Ausgabe-Features, die die lokale Lee's L-Statistik, die Kategorien der räumlichen Zuordnung, die p-Werte und die gewichteten Mittelwerte der Nachbarn des jeweiligen Features enthalten.

Feature Class
Nachbarschaftstyp
(optional)

Gibt an, wie die Nachbarn der einzelnen Features festgelegt werden. Das Feature ist immer in der Nachbarschaft enthalten, und alle Nachbarschaftsgewichtungen werden auf die Summe 1 normalisiert.

  • Festes EntfernungsbandFeatures innerhalb einer angegebenen kritischen Entfernung von jedem Feature werden als Nachbarn einbezogen. Hierbei handelt es sich um den Standard für Punkt-Features.
  • Nächste Nachbarn (K)Die nächstgelegenen k-Features werden als Nachbarn einbezogen.
  • Nur benachbarte KantenPolygon-Features, die eine Kante gemeinsam haben, werden als Nachbarn einbezogen.
  • Benachbarte Kanten/EckenPolygon-Features, die eine gemeinsame Kante oder Ecke aufweisen, werden als Nachbarn einbezogen. Hierbei handelt es sich um den Standard für Polygon-Features.
  • Delaunay-TriangulationPunkte, deren Delaunay-Triangulationen (Thiessen-Polygone) eine gemeinsame Kante oder Ecke haben, werden als Nachbarn einbezogen.
  • Räumliche Gewichtungen aus Datei abrufenNachbarn und Gewichtungen werden durch eine Datei mit räumlichen Gewichtungen definiert.
String
Entfernungsband
(optional)

Das Entfernungsband, das zur Bestimmung der Nachbarn um das fokale Feature verwendet wird. Wenn kein Wert angegeben wird, ist die Entfernung die kürzeste Entfernung, sodass jedes Feature mindestens einen anderen Nachbarn in seiner Nachbarschaft hat. Bei Polygonen wird zur Bestimmung der Nachbarn die Entfernung zwischen Schwerpunkten verwendet.

Linear Unit
Anzahl der Nachbarn
(optional)

Die Anzahl der Nachbarn um jedes Feature, die als Nachbarn miteinbezogen werden. Der Wert beinhaltet nicht das Feature. Wenn Sie beispielsweise 6 angeben, werden das Feature und seine sechs engsten Nachbarn (insgesamt sieben Features) verwendet. Der Standardwert ist 8. Der Wert muss mindestens 2 betragen.

Long
Gewichtungsmatrix-Datei
(optional)

Der Pfad und Dateiname der Datei mit räumlicher Gewichtungsmatrix, die die Nachbarn und Gewichtungen zwischen den Features definiert.

File
Lokales Gewichtungsschema
(optional)

Gibt das Gewichtungsschema an, das bei der Berechnung räumlicher Zuordnungen auf Nachbarn angewendet wird.

  • UngewichtetNachbarn werden nicht gewichtet. Dies ist die Standardeinstellung.
  • BiquadratNachbarn werden mit einem Quartic-Kernel (Biquadrat) gewichtet.
String
Kernel-Bandbreite
(optional)

Die Bandbreite für den Biquadrat-Kernel. Die Bandbreite bestimmt, wie schnell sich die Gewichtungen mit zunehmender Entfernung verringern. Bei größeren Bandbreiten werden Nachbarn, die weiter vom Feature entfernt sind, vergleichsweise stärker gewichtet. Für die Nachbarschaft "Nächste Nachbarn (K)" wird mit dem Standardwert (leer) eine adaptive Bandbreite verwendet, die der Entfernung zum Nachbarn (k+1) des fokalen Features entspricht. Für den festgelegten Nachbarschaftstyp "Entfernungsband" wird beim Standardwert (leer) derselbe Wert wie für das Entfernungsband verwendet.

Linear Unit
Anzahl der Permutationen
(optional)

Gibt die Anzahl der Permutationen an, die bei der Berechnung von globalen und lokalen p-Werten zum Erstellen von Referenzverteilungen verwendet werden. Alle p-Werte werden anhand beidseitiger Hypothesentests berechnet.

  • 99In der Analyse werden 99 Permutationen verwendet. Bei 99 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,02. Alle anderen p-Werte sind Vielfache dieses Wertes.
  • 199In der Analyse werden 199 Permutationen verwendet. Bei 199 Permutationen ist der kleinstmögliche p-Wert 0,01. Alle anderen p-Werte sind Vielfache dieses Wertes.
  • 499In der Analyse werden 499 Permutationen verwendet. Bei 499 Permutationen ist der kleinstmögliche p-Wert 0,004. Alle anderen p-Werte sind Vielfache dieses Wertes.
  • 999In der Analyse werden 999 Permutationen verwendet. Bei 999 Permutationen ist der kleinstmögliche p-Wert 0,002. Alle anderen p-Werte sind Vielfache dieses Wertes. Diese Option wird für 90-Prozent-Konfidenztests empfohlen. Dies ist die Standardeinstellung.
  • 4999In der Analyse werden 4.999 Permutationen verwendet. Bei 4.999 Permutationen ist der kleinstmögliche p-Wert 0,0004. Alle anderen p-Werte sind Vielfache dieses Wertes. Diese Option wird für 95-Prozent-Konfidenztests empfohlen.
  • 9999In der Analyse werden 9.999 Permutationen verwendet. Bei 9.999 Permutationen ist der kleinstmögliche p-Wert 0,0002. Alle anderen p-Werte sind Vielfache dieses Wertes. Diese Option wird für 99-Prozent-Konfidenztests empfohlen.
Long

Abgeleitete Ausgabe

BeschriftungErläuterungDatentyp
Lee's L

Die Lee's L-Statistik für die Analysevariablen.

Double
p-Wert

Der p-Wert für die Lee's L-Statistik.

Double
Pearson-Korrelation

Die Pearson-Korrelation zwischen den Analysevariablen.

Double

arcpy.stats.BivariateSpatialAssociation(in_features, analysis_field1, analysis_field2, out_features, {neighborhood_type}, {distance_band}, {num_neighbors}, {weights_matrix_file}, {local_weighting_scheme}, {kernel_bandwidth}, {num_permutations})
NameErläuterungDatentyp
in_features

Die Eingabe-Features enthalten die Felder der beiden Analysevariablen.

Feature Layer
analysis_field1

Das Feld der ersten Analysevariablen. Das Feld muss numerisch sein.

Field
analysis_field2

Das Feld der zweiten Analysevariablen. Das Feld muss numerisch sein.

Field
out_features

Die Ausgabe-Features, die die lokale Lee's L-Statistik, die Kategorien der räumlichen Zuordnung, die p-Werte und die gewichteten Mittelwerte der Nachbarn des jeweiligen Features enthalten.

Feature Class
neighborhood_type
(optional)

Gibt an, wie die Nachbarn der einzelnen Features festgelegt werden. Das Feature ist immer in der Nachbarschaft enthalten, und alle Nachbarschaftsgewichtungen werden auf die Summe 1 normalisiert.

  • DISTANCE_BANDFeatures innerhalb einer angegebenen kritischen Entfernung von jedem Feature werden als Nachbarn einbezogen. Hierbei handelt es sich um den Standard für Punkt-Features.
  • K_NEAREST_NEIGHBORSDie nächstgelegenen k-Features werden als Nachbarn einbezogen.
  • CONTIGUITY_EDGES_ONLYPolygon-Features, die eine Kante gemeinsam haben, werden als Nachbarn einbezogen.
  • CONTIGUITY_EDGES_CORNERSPolygon-Features, die eine gemeinsame Kante oder Ecke aufweisen, werden als Nachbarn einbezogen. Hierbei handelt es sich um den Standard für Polygon-Features.
  • DELAUNAY_TRIANGULATIONPunkte, deren Delaunay-Triangulationen (Thiessen-Polygone) eine gemeinsame Kante oder Ecke haben, werden als Nachbarn einbezogen.
  • GET_SPATIAL_WEIGHTS_FROM_FILENachbarn und Gewichtungen werden durch eine Datei mit räumlichen Gewichtungen definiert.
String
distance_band
(optional)

Das Entfernungsband, das zur Bestimmung der Nachbarn um das fokale Feature verwendet wird. Wenn kein Wert angegeben wird, ist die Entfernung die kürzeste Entfernung, sodass jedes Feature mindestens einen anderen Nachbarn in seiner Nachbarschaft hat. Bei Polygonen wird zur Bestimmung der Nachbarn die Entfernung zwischen Schwerpunkten verwendet.

Linear Unit
num_neighbors
(optional)

Die Anzahl der Nachbarn um jedes Feature, die als Nachbarn miteinbezogen werden. Der Wert beinhaltet nicht das Feature. Wenn Sie beispielsweise 6 angeben, werden das Feature und seine sechs engsten Nachbarn (insgesamt sieben Features) verwendet. Der Standardwert ist 8. Der Wert muss mindestens 2 betragen.

Long
weights_matrix_file
(optional)

Der Pfad und Dateiname der Datei mit räumlicher Gewichtungsmatrix, die die Nachbarn und Gewichtungen zwischen den Features definiert.

File
local_weighting_scheme
(optional)

Gibt das Gewichtungsschema an, das bei der Berechnung räumlicher Zuordnungen auf Nachbarn angewendet wird.

  • UNWEIGHTEDNachbarn werden nicht gewichtet. Dies ist die Standardeinstellung.
  • BISQUARENachbarn werden mit einem Quartic-Kernel (Biquadrat) gewichtet.
String
kernel_bandwidth
(optional)

Die Bandbreite für den Biquadrat-Kernel. Die Bandbreite bestimmt, wie schnell sich die Gewichtungen mit zunehmender Entfernung verringern. Bei größeren Bandbreiten werden Nachbarn, die weiter vom Feature entfernt sind, vergleichsweise stärker gewichtet. Für die Nachbarschaft "Nächste Nachbarn (K)" wird mit dem Standardwert (leer) eine adaptive Bandbreite verwendet, die der Entfernung zum Nachbarn (k+1) des fokalen Features entspricht. Für den festgelegten Nachbarschaftstyp "Entfernungsband" wird beim Standardwert (leer) derselbe Wert wie für das Entfernungsband verwendet.

Linear Unit
num_permutations
(optional)

Gibt die Anzahl der Permutationen an, die bei der Berechnung von globalen und lokalen p-Werten zum Erstellen von Referenzverteilungen verwendet werden. Alle p-Werte werden anhand beidseitiger Hypothesentests berechnet.

  • 99In der Analyse werden 99 Permutationen verwendet. Bei 99 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,02. Alle anderen p-Werte sind Vielfache dieses Wertes.
  • 199In der Analyse werden 199 Permutationen verwendet. Bei 199 Permutationen ist der kleinstmögliche p-Wert 0,01. Alle anderen p-Werte sind Vielfache dieses Wertes.
  • 499In der Analyse werden 499 Permutationen verwendet. Bei 499 Permutationen ist der kleinstmögliche p-Wert 0,004. Alle anderen p-Werte sind Vielfache dieses Wertes.
  • 999In der Analyse werden 999 Permutationen verwendet. Bei 999 Permutationen ist der kleinstmögliche p-Wert 0,002. Alle anderen p-Werte sind Vielfache dieses Wertes. Diese Option wird für 90-Prozent-Konfidenztests empfohlen. Dies ist die Standardeinstellung.
  • 4999In der Analyse werden 4.999 Permutationen verwendet. Bei 4.999 Permutationen ist der kleinstmögliche p-Wert 0,0004. Alle anderen p-Werte sind Vielfache dieses Wertes. Diese Option wird für 95-Prozent-Konfidenztests empfohlen.
  • 9999In der Analyse werden 9.999 Permutationen verwendet. Bei 9.999 Permutationen ist der kleinstmögliche p-Wert 0,0002. Alle anderen p-Werte sind Vielfache dieses Wertes. Diese Option wird für 99-Prozent-Konfidenztests empfohlen.
Long

Abgeleitete Ausgabe

NameErläuterungDatentyp
lee_l

Die Lee's L-Statistik für die Analysevariablen.

Double
p_value

Der p-Wert für die Lee's L-Statistik.

Double
corr

Die Pearson-Korrelation zwischen den Analysevariablen.

Double

Codebeispiel

BivariateSpatialAssociation: Beispiel 1 (Python-Fenster)

Das folgende Skript im Python-Fenster veranschaulicht, wie Sie die Funktion BivariateSpatialAssociation verwenden.

# Calculate the Lee's L statistic using eight nearest neighbors
# and adaptive bandwidth.
arcpy.env.workspace = r"c:\data\project_data.gdb"
arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="K_NEAREST_NEIGHBORS",
    distance_band=None,
    num_neighbors=8,
    weights_matrix_file=None,
    local_weighting_scheme="BISQUARE",
    kernel_bandwidth=None,
    num_permutations=9999
)
BivariateSpatialAssociation: Beispiel 2 (eigenständiges Skript)

Das folgende eigenständige Skript veranschaulicht, wie die Funktion BivariateSpatialAssociation verwendet wird.

# Calculate the Lee's L statistic for two analysis fields.  

import arcpy 

# Set the current workspace
arcpy.env.workspace = r"c:\data\project_data.gdb" 

# Run tool

arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="CONTIGUITY_EDGES_CORNERS",
    distance_band=None,
    num_neighbors=None,
    weights_matrix_file=None,
    local_weighting_scheme="UNWEIGHTED",
    kernel_bandwidth=None,
    num_permutations=9999
)

# Print the messages. The messages include the Lee's L statistic, p-value, 
# Pearson correlations, and spatial smoothing scalars.

print(arcpy.GetMessages())

Lizenzinformationen

  • Basic: Ja
  • Standard: Ja
  • Advanced: Ja

Verwandte Themen