Kolokalitätsanalyse (Spatial Statistics)

Zusammenfassung

Misst mithilfe der Statistik des Kolokationsquotienten lokale Muster der räumlichen Zuordnung oder der Kolokalität zwischen zwei Kategorien von Punkt-Features.

Weitere Informationen zur Funktionsweise des Werkzeugs Kolokalitätsanalyse

Abbildung

Diagramm der Kolokalitätsanalyse

Verwendung

  • Dieses Werkzeug akzeptiert nur Punkt-Features. Die zu analysierenden Kategorien können in einem Dataset oder zwei separaten Datasets enthalten sein. Sie können auch zwei separate Datasets verwenden, die als Kategorien angesehen werden. Angenommen, Sie verfügen über ein Punkt-Dataset mit vielen Typen von Restaurants, die als Kategorie RESTAURANTS angesehen werden, und ein weiteres Punkt-Dataset, das viele Typen von Straftaten enthält, die nur als Kategorie CRIMES angesehen werden.

  • Das Werkzeug bestimmt für jedes Feature der Interessenskategorie, ob die Features der Nachbarkategorie in größerem oder geringerem Umfang als die gesamte räumliche Verteilung der Kategorien in der Nachbarschaft des Features vorhanden sind. Wenn z. B. für jedes Feature der Kategorie A der Quotient für lokale Kolokalität (LCLQ) den Wert 1 hat, entspricht die Wahrscheinlichkeit, dass Kategorie B benachbart ist, der von Ihnen erwarteten Wahrscheinlichkeit. Bei einem höheren LCLQ-Wert als 1 ist die Wahrscheinlichkeit höher (als die Zufallswahrscheinlichkeit), dass B benachbart ist. Bei einem niedrigeren LCLQ-Wert als 1 ist die Wahrscheinlichkeit geringer (als bei einer Zufallsverteilung), dass das Feature von Kategorie A einen Punkt der Kategorie B als Nachbar hat.

    Hinweis:

    Die Kolokalitätsbeziehung dieser Analyse ist nicht symmetrisch. Die Werte des Kolokalitätsquotienten beim Vergleichen von Kategorie A mit Kategorie B unterscheiden sich von den Werten des Kolokalitätsquotienten beim Vergleichen von Kategorie B mit Kategorie A.

    Wenn die Nachbarschaft Kategorie C enthält, ergeben sich andere Kolokalitätsquotienten als wenn nur Kategorie A und B vorhanden sind. Je nach Fragestellung sollten Sie möglicherweise eine Teilmenge der Daten erstellen, die nur Kategorie A und B enthält. Beim Erstellen einer Teilmenge gehen jedoch die Informationen über die anderen vorhandenen Kategorien verloren. In Fällen, in denen Sie genau wissen, dass sich das Vorhandensein einer Kategorie nicht auf das Vorkommen einer anderen Kategorie auswirkt, sollten Sie eine Teilmenge der Daten auswählen und erstellen.

  • Sie können mit den Parametern Entfernungsband und Nächste Nachbarn (K) eine räumliche Beziehung oder mit dem Parameter Nachbarschaftstyp eine Datei mit räumlicher Gewichtungsmatrix definieren.

  • Sie können die Daten mit Raum-Zeit-Fenstern analysieren, indem Sie die Parameter Interessen-Zeitfeld, Nachbarkategorien-Zeitfeld und Typ der zeitlichen Beziehung festlegen. Mithilfe von Raum-Zeit-Fenstern können Sie steuern, welche Features in die zu analysierende Nachbarschaft aufgenommen werden. Features, die räumlich und zeitlich nahe beieinander liegen, werden zusammen analysiert, da alle Feature-Beziehungen im Hinblick auf die Position und den Zeitstempel des Ziel-Features ausgewertet werden. Sie können auch festlegen, ob das Werkzeug Features vor oder nach dem Ziel-Feature sucht, oder eine Zeitspanne erstellen, in der das Werkzeug Features vor und nach dem zu analysierenden Ziel-Feature sucht.

  • Der Parameter Anzahl der Permutationen dient zum Berechnen von p-Werten. Bei der Auswahl der Anzahl von Permutationen muss zwischen Genauigkeit und erhöhter Verarbeitungszeit abgewogen werden. Der Standardwert beträgt 99 Permutationen. Es wird jedoch empfohlen, für die endgültigen Analyseergebnisse die Anzahl der Permutationen zu erhöhen.

  • Durch Angabe eines Pfades für den Parameter Ausgabetabelle für globale Beziehungen kann ein Quotient für globale Kolokalität berechnet werden. Diese Tabelle enthält Kolokalitätsquotienten, sodass Sie die Maße der räumlichen Zuordnung zwischen allen Kategorien im Dataset analysieren können. Dies ermöglicht Ihnen das Erkunden weiterer Beziehungen in den Daten, wenn Sie global weitere Kategorien mit starker Kolokalität finden. Wenn Sie weitere Kategorien mit starker Kolokalität finden, können Sie die Analyse erweitern. Hierzu können Sie die lokale Beschaffenheit dieser Beziehung erkunden, indem Sie das Werkzeug erneut mit diesen relevanten Kategorien ausführen. Oder Sie können das Werkzeug erneut ausführen, indem Sie diese Kategorien aus der Analyse entfernen, wenn Sie vermuten, dass die Kategorien mit starker Kolokalität die Ergebnisse unnötig verzerren.

  • Die Ausgabe dieses Werkzeugs ist eine Karte, auf der die Symbolisierung der Relevanten Eingabe-Features angibt, ob sie wesentlich lagegleich mit den Benachbarten Eingabe-Features oder von diesen abgeschieden sind. Das Werkzeug fügt den Ausgabe-Features Felder hinzu, einschließlich des berechneten Quotienten für lokale Kolokalität des p-Wertes, des für die Symbolisierung verwendeten LCLQ-Abschnitts und des LCQL-Typs. Es kann eine optionale Ausgabetabelle für globale Beziehungen angegeben werden, in der die Quotienten für globale Kolokalität zwischen allen Kategorien im Interessensfeld und allen Kategorien im Feld, das die Nachbarkategorie enthält, aufgeführt sind.

  • Dieses Werkzeug unterstützt eine Parallelverarbeitung und nutzt standardmäßig 50 Prozent der verfügbaren Prozessoren. Die Anzahl der Prozessoren kann mit der Umgebung Faktor für parallele Verarbeitung erhöht oder verringert werden.

Syntax

ColocationAnalysis(input_type, in_features_of_interest, output_features, {field_of_interest}, {time_field_of_interest}, {category_of_interest}, {input_feature_for_comparison}, {field_for_comparison}, {time_field_for_comparison}, {category_for_comparison}, neighborhood_type, {number_of_neighbors}, {distance_band}, {weights_matrix_file}, {temporal_relationship_type}, {time_step_interval}, {number_of_permutations}, {local_weighting_scheme}, {output_table})
ParameterErklärungDatentyp
input_type

Gibt an, ob die in_features_of_interest aus demselben Dataset mit den angegebenen Kategorien, aus anderen Datasets mit angegebenen Kategorien oder aus anderen Datasets stammen, die als eigene Kategorie behandelt werden (z. B. ein Dataset, in dem alle Punkte Geparden darstellen, und ein weiteres Dataset, in dem alle Punkte Gazellen darstellen).

  • SINGLE_DATASETDie zu analysierenden Kategorien sind in einem Feld in einem einzelnen Dataset vorhanden.
  • TWO_DATASETSDie zu analysierenden Kategorien sind in Feldern verschiedener Datasets vorhanden.
  • DATASETS_WITHOUT_CATEGORIESEs werden zwei separate Datasets analysiert, die zwei Kategorien darstellen.
String
in_features_of_interest

Die Feature-Class, die Punkte mit repräsentativen Kategorien enthält.

Feature Layer
output_features

Die Ausgabe-Feature-Class, die alle in_features mit Feldern enthält, die die Quotienten für lokale Kolokalität und die p-Werte darstellen.

Feature Class
field_of_interest
(optional)

Das Feld, das die zu analysierende(n) Kategorie(n) enthält.

Field
time_field_of_interest
(optional)

Ein Datumsfeld mit einem optionalen Zeitstempel für jedes Feature, um Punkte mithilfe eines Raum-Zeit-Fensters zu analysieren. Features, die in Raum und Zeit einen geringen Abstand zueinander aufweisen, gelten als Nachbarn und werden gemeinsam analysiert.

Field
category_of_interest
(optional)

Die Basiskategorie für die Analyse. Das Werkzeug bestimmt für jede category_of_interest den Grad des Interesses der Basiskategorie an der neighboring_category oder ihrer Kolokalität mit dieser.

String
input_feature_for_comparison
(optional)

Die Eingabe-Feature-Class, in der sich die Punkte mit den zu vergleichenden Kategorien befinden.

Feature Layer
field_for_comparison
(optional)

Das Feld aus dem input_feature_for_comparison, das die zu vergleichende Kategorie enthält.

Field
time_field_for_comparison
(optional)

Ein Datumsfeld mit einem Zeitstempel für jedes Feature, um die Punkte mithilfe eines Raum-Zeit-Fensters zu analysieren. Features, die in Raum und Zeit einen geringen Abstand zueinander aufweisen, gelten als Nachbarn und werden gemeinsam analysiert.

Field
category_for_comparison
(optional)

Die Nachbarkategorie für die Analyse. Das Werkzeug bestimmt den Grad des Interesses der category_of_interest an der Nachbarkategorie oder ihrer Abgrenzung von der category_for_comparison.

String
neighborhood_type

Gibt an, wie die räumlichen Beziehungen zwischen Features definiert werden.

  • DISTANCE_BANDJedes Feature wird im Kontext benachbarter Features analysiert. Benachbarte Features innerhalb der durch den Parameter distance_bandangegebenen kritischen Entfernung erhalten die Gewichtung 1 und beeinflussen die Berechnungen für das Ziel-Feature. Benachbarte Features außerhalb der kritischen Entfernung erhalten eine Gewichtung von 0 und haben keinen Einfluss auf die Berechnungen eines Ziel-Features.
  • K_NEAREST_NEIGHBORSDie nächstgelegenen k-Features werden in die Analyse als Nachbarn einbezogen. Die Anzahl der Nachbarn wird durch den Parameter number_of_neighbors angegeben. Der Einfluss des Nachbarn in der Analyse wird anhand der Entfernung zum am weitesten entfernten Nachbarn gewichtet. Dies ist die Standardeinstellung.
  • GET_SPATIAL_WEIGHTS_FROM_FILEWenn SINGLE_DATASET als input_type verwendet wird, können die räumlichen Beziehungen durch eine Datei mit räumlicher Gewichtungsmatrix definiert werden. Der Einfluss des Nachbarn in der Analyse wird anhand der Entfernung zum am weitesten entfernten Nachbarn gewichtet. Der Pfad zur Datei mit räumlichen Gewichtungen wird durch den Parameter weights_matrix_file angegeben.
String
number_of_neighbors
(optional)

Die Anzahl der Nachbarn um jedes Feature, die zum Testen auf lokale Beziehungen zwischen Kategorien verwendet werden. Wenn das Feld leer gelassen wird, lautet der Standardwert 8. Der angegebene Wert sollte groß genug sein, um Beziehungen zwischen Features erkennen zu können, aber noch klein genug, um auch lokale Muster ausmachen zu können.

Long
distance_band
(optional)

Die Nachbarschaftsgröße ist eine konstante oder feste Entfernung für jedes Feature. Alle Features innerhalb dieser Entfernung werden zum Testen auf lokale Beziehungen zwischen Kategorien verwendet. Wenn das Feld leer gelassen wird, wird die durchschnittliche Entfernung der einzelnen Features zu mindestens 8 Nachbarn verwendet.

Linear Unit
weights_matrix_file
(optional)

Der Pfad zu einer Datei mit Gewichtungen, die räumliche und potenziell zeitliche Beziehungen unter Features definieren.

File
temporal_relationship_type
(optional)

Gibt an, wie zeitliche Beziehungen zwischen Features definiert werden.

  • BEFOREDas Zeitfenster für jedes der in_features_of_interest liegt in der Vergangenheit. Benachbarte Features müssen über einen Datums-/Zeitstempel verfügen, der vor dem Datums-/Zeitstempel des relevanten Features liegt, das in die Analyse aufgenommen werden soll. Dies ist die Standardeinstellung.
  • AFTERDas Zeitfenster für jedes der in_features_of_interest liegt in der Zukunft. Benachbarte Features müssen über einen Datums-/Zeitstempel verfügen, der nach dem Datums-/Zeitstempel des relevanten Features liegt, das in die Analyse aufgenommen werden soll.
  • SPANDas Zeitfenster für jedes der in_features_of_interest liegt in der Vergangenheit und Zukunft. In die Analyse werden benachbarte Features aufgenommen, deren Datums-/Zeitstempel im time_step_interval vor oder nach dem Datums-/Zeitstempel des relevanten Features liegt. Wenn time_step_interval z. B. auf 1 Woche festgelegt ist, umfasst das Fenster 1 Woche vor und 1 Woche nach dem Ziel-Feature.
String
time_step_interval
(optional)

Eine ganze Zahl und Maßeinheit, die die Anzahl an Zeiteinheiten darstellen, die das Zeitfenster bilden.

Time Unit
number_of_permutations
(optional)

Diese Analyse verwendet Permutationen, um eine Referenzverteilung zu erstellen. Bei der Auswahl der Anzahl von Permutationen muss zwischen Genauigkeit und erhöhter Verarbeitungszeit abgewogen werden. Legen Sie Ihre Präferenz für Geschwindigkeit im Vergleich zu Genauigkeit fest. Robuste und präzise Ergebnisse erfordern mehr Zeit zur Berechnung.

  • 99Bei 99 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,02. Alle anderen Pseudo-p-Werte sind Vielfache dieses Wertes. Dies ist die Standardeinstellung.
  • 199Bei 199 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,01 und alle anderen Pseudo-p-Werte sind gerade Vielfache dieses Wertes.
  • 499Bei 499 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,004 und alle anderen Pseudo-p-Werte sind gerade Vielfache dieses Wertes.
  • 999Bei 999 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,002 und alle anderen Pseudo-p-Werte sind gerade Vielfache dieses Wertes.
  • 9999Bei 9999 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,0002 und alle anderen Pseudo-p-Werte sind gerade Vielfache dieses Wertes.
Long
local_weighting_scheme
(optional)

Gibt den Kernel-Typ an, mit dem die räumliche Gewichtung bereitgestellt wird. Der Kernel definiert, in welchem Zusammenhang die einzelnen Features mit anderen Features in ihrer Nachbarschaft stehen.

  • BISQUAREFeatures werden anhand der Entfernung zum am weitesten entfernten Nachbarn oder anhand der Entfernung zum Rand des Entfernungsbandes gewichtet. Jedes Feature außerhalb der angegebenen Nachbarschaft erhält die Gewichtung 0.
  • GAUSSIANFeatures werden anhand der Entfernung zum am weitesten entfernten Nachbarn oder anhand der Entfernung zum Rand des Entfernungsbandes gewichtet. Die Gewichtung nimmt jedoch schneller ab als bei Verwendung von Biquadrat. Einem Feature außerhalb der angegebenen Nachbarschaft wird die Gewichtung 0 zugewiesen. Dies ist die Standardeinstellung.
  • NONEEs wird kein Gewichtungsschema angewendet. Alle Features innerhalb der Nachbarschaft werden mit 1 gewichtet und haben den gleichen Einfluss. Alle Features außerhalb der Nachbarschaft erhalten die Gewichtung 0.
String
output_table
(optional)

Wenn für diesen Parameter ein Wert angegeben wird, wird eine Tabelle erzeugt, in der die Quotienten für globale Kolokalität zwischen allen Kategorien im Interessensfeld und allen Kategorien im Feld, das die Nachbarkategorie enthält, aufgeführt sind. Diese Tabelle kann zur Erkundung verwendet werden, um die lokalen Kategorien zu bestimmen, die analysiert werden sollen.

Wenn Datasets ohne Kategorien als Eingabetyp verwendet wird, werden Quotienten für globale Kolokalität für alle Datasets untereinander und für jedes Dataset in Bezug auf sich selbst berechnet.

Table

Codebeispiel

ColocationAnalysis – Beispiel 1 (Python-Fenster)

Die folgenden Skripts im Python-Fenster veranschaulichen, wie Sie die Funktion ColocationAnalysis verwenden.

import arcpy
arcpy.env.workspace = r"C:\Analysis"
# Two categories from the same categorical field.
# Find the colocation of elementary schools and middle schools
arcpy.stats.ColocationAnalysis("SINGLE_DATASET", r"Colocation.gdb\Schools",
                               r"Outputs.gdb\School_Colocation", "Facility_Type", None,
                               "Elementary", None, None, None, "Middle", "K_NEAREST_NEIGHBORS",
                               8, None, None, "BEFORE", None, 99, "BISQUARE",
                               r"Outputs.gdb\Global_School_Colocation")
# Categories from different datasets without categories
# Find the colocation of elementary schools and hospitals
arcpy.stats.ColocationAnalysis("DATASETS_WITHOUT_CATEGORIES", r"Colocation.gdb\Schools",
                               r"Outputs.gdb\Schools_Hospitals", None, None, '',
                               r"Colocation.gdb\Hospitals", None, None, '', "DISTANCE_BAND",
                               None, "30 Kilometers", None, "BEFORE", None, 199, "GAUSSIAN",
                               None)
# Categories from two datasets
# Find the colocation of elementary schools and hospitals
arcpy.stats.ColocationAnalysis("TWO_DATASETS", r"Colocation.gdb\Schools",
                               r"Outputs.gdb\Elementary_Hospitals", "Facility_Type", None,
                               "Elementary", r"Colocation.gdb\Hospitals", None, None, '',
                               "K_NEAREST_NEIGHBORS", 15, None, None, "BEFORE", None, 499,
                               "NONE", None)
ColocationAnalysis – Beispiel 2 (eigenständiges Skript)

Im folgenden eigenständigen Python-Skript wird veranschaulicht, wie Sie die Funktion ColocationAnalysis verwenden.

# Analyze the spatial relationship (colocation) between elementary school locations and hospital locations
# Two categories from the same categorical field.
# Find the colocation of elementary schools and  middle schools
intype = "SINGLE_DATASET"
infc_interest = r"Colocation.gdb\Schools"
outfc = r"Outputs.gdb\School_Colocation"
field_interest = "Facility_Type"
time_field = ""
cat_interest = "Elementary"
infc_neigh = ""
field_neigh = ""
time_field_neigh = ""
cat_neigh = "Middle"
neighborhood_type = "K_NEAREST_NEIGHBORS"
num_neighbors = 8
dist_band = ""
swm_file = ""
temporal_type = ""
time_step_interval = ""
num_permutation = 99
weighting_scheme ="BISQUARE"
out_global_tbl = r"Outputs.gdb\Global_School_Colocation"
arcpy.stats.ColocationAnalysis(intype, infc_interest, outfc, field_interest,
                               time_field, cat_interest, infc_neigh, field_neigh,
                               time_field_neigh, cat_neigh, neighborhood_type,
                               num_neighbors, dist_band, swm_file, temporal_type,
                               time_step_interval num_permutation, weighting_scheme,
                               out_global_tbl)
# Categories from different datasets without categories
# Find the colocation of schools and hospitals
intype = "DATASETS_WITHOUT_CATEGORIES"
infc_interest = r"Colocation.gdb\Schools"
outfc = r"Outputs.gdb\Schools_Hospitals"
field_interest = ""
time_field = ""
cat_interest = ""
infc_neigh = r"Colocation.gdb\Hospitals"
field_neigh = ""
time_field_neigh = ""
cat_neigh = ""
neighborhood_type = "DISTANCE_BAND"
num_neighbors = ""
dist_band = "30 Kilometers"
swm_file = ""
temporal_type = ""
time_step_interval = ""
num_permutation = 199
weighting_scheme ="GAUSSIAN"
out_global_tbl = ""
arcpy.stats.ColocationAnalysis(intype, infc_interest, outfc, field_interest,
                               time_field, cat_interest, infc_neigh, field_neigh,
                               time_field_neigh, cat_neigh, neighborhood_type,
                               num_neighbors, dist_band, swm_file, temporal_type,
                               time_step_interval num_permutation, weighting_scheme,
                               out_global_tbl)
# Categories from two datasets
# Find the colocation of elementary schools and hospitals
intype = "TWO_DATASETS"
infc_interest = r"Colocation.gdb\Schools"
outfc = r"Outputs.gdb\Elementary_Hospitals"
field_interest = "Facility_Type"
time_field = ""
cat_interest = "Elementary"
infc_neigh = r"Colocation.gdb\Hospitals"
field_neigh = ""
time_field_neigh = ""
cat_neigh = ""
neighborhood_type = "K_NEAREST_NEIGHBORS"
num_neighbors = 15
dist_band = ""
swm_file = ""
temporal_type = ""
time_step_interval = ""
num_permutation = 499
weighting_scheme ="NONE"
out_global_tbl = ""
arcpy.stats.ColocationAnalysis(intype, infc_interest, outfc, field_interest,
                               time_field, cat_interest, infc_neigh, field_neigh,
                               time_field_neigh, cat_neigh, neighborhood_type,
                               num_neighbors, dist_band, swm_file, temporal_type,
                               time_step_interval num_permutation, weighting_scheme,
                               out_global_tbl)

Lizenzinformationen

  • Basic: Ja
  • Standard: Ja
  • Advanced: Ja

Verwandte Themen