Cluster- und Ausreißeranalyse (Anselin Local Morans I) (Spatial Statistics)—ArcGIS Pro

Zusammenfassung

Dieses Werkzeug identifiziert in einem Satz gewichteter Features mithilfe der Anselin Local Morans I-Statistik statistisch signifikante Hot-Spots, Cold-Spots und räumliche Ausreißer.

Weitere Informationen zur Funktionsweise der Cluster- und Ausreißeranalyse (Anselin Local Morans I)

Abbildung

Verwendung

Mit diesem Werkzeug wird eine neue Ausgabe-Feature-Class anhand der folgenden Attribute für jedes Feature in der Eingabe-Feature-Class erstellt: Local Morans I-Index, Z-Wert, Pseudo-p-Wert und Cluster-/Ausreißer-Typ (COType).
Die Z-Werte und p-Werte sind Werte von statistischer Bedeutung, die Aufschluss darüber geben, ob Sie die NULL-Hypothese auf Feature-Ebene ablehnen können oder nicht. Genau genommen geben Sie an, ob die scheinbare Ähnlichkeit (eine räumliche Cluster-Bildung von hohen oder niedrigen Werten) oder die Unterschiede (ein räumlicher Ausreißer) auffälliger sind als bei einer zufälligen Verteilung. Die p-Werte und Z-Werte in der Ausgabe-Feature-Class spiegeln keine FDR-Korrekturen (False Discovery Rate) wider.
Ein hoher positiver Z-Wert für ein Feature deutet darauf hin, dass die umgebenden Features ähnliche Werte (hohe oder niedrige Werte) aufweisen. Das COType-Feld in der Ausgabe-Feature-Class ist HH für einen statistisch signifikanten Cluster mit hohen Werten und LL für einen statistisch signifikanten Cluster mit niedrigen Werten.
Ein niedriger negativer Z-Wert (beispielsweise -3,96) für ein Feature deutet auf einen statistisch signifikanten Ausreißer räumlicher Daten hin. Das COType-Feld in der Ausgabe-Feature-Class gibt an, ob das Feature einen hohen Wert aufweist und von Features mit niedrigen Werten (HL) umgeben ist, oder ob das Feature einen niedrigen Wert aufweist und von Features mit hohen Werten (LH) umgeben ist.
Das COType-Feld gibt immer statistisch signifikante Cluster und Ausreißer für ein Konfidenzniveau von 95 Prozent an. Nur statistisch signifikante Features verfügen über Werte für das COType-Feld. Wenn Sie den optionalen Parameter FDR-Korrektur anwenden (False Discovery Rate) aktivieren, basiert die statistische Signifikanz auf einem korrigierten Konfidenzniveau von 95 Prozent.
Das Standard-Rendering für die Ausgabe-Feature-Class basiert auf den Werten des COType-Feldes.
Die Ausgabe dieses Werkzeugs umfasst auch ein Histogramm mit einer Darstellung des Wertes im Eingabefeld sowie einen Morans-Scatterplot. Diese Diagramme können im Bereich Inhalt unter der Ausgabe-Feature-Class aufgerufen werden.
Permutationen werden verwendet, um zu bestimmen, wie hoch die Wahrscheinlichkeit ist, die analysierten Werte tatsächlich mit der vorhandenen räumlichen Verteilung aufzufinden. Für jede Permutation werden die Nachbarschaftswerte um jedes Feature zufällig neu angeordnet und der Local Morans I-Wert berechnet. Das Ergebnis ist eine Referenzverteilung von Werten, die daraufhin mit den tatsächlich beobachteten Morans I-Werten verglichen wird, um zu bestimmen, mit welcher Wahrscheinlichkeit der beobachtete Wert in der zufälligen Verteilung gefunden werden kann. Die Standardeinstellung liegt bei 499 Permutationen. Die zufällige Beispielverteilung und damit die Genauigkeit des Pseudo-p-Wertes wird jedoch durch eine zunehmende Anzahl von Permutationen verbessert.
Wenn der Parameter Anzahl der Permutationen auf 0 festgelegt wird, ist das Ergebnis ein herkömmlicher p-Wert anstelle eines Pseudo-p-Wertes und der Z-Wert basiert auf der Berechnung per Zufalls-NULL-Hypothese. Weitere Informationen zu Z-Werten und p-Werten finden Sie unter Was ist ein Z-Wert? Was ist ein p-Wert?
Wenn die Eingabe-Feature-Class nicht projiziert ist (d. h., wenn Koordinaten in Grad, Minuten und Sekunden angegeben werden) oder als Ausgabe-Koordinatensystem ein geographisches Koordinatensystem festgelegt wurde, werden Entfernungen mit Sehnenmesswerten berechnet. Sehnenentfernungsmesswerte werden verwendet, weil sie schnell berechnet werden können und ausgezeichnete Schätzungen von echten geodätischen Entfernungen zulassen, zumindest für Punkte innerhalb von 30 Grad voneinander. Sehnenentfernungen basieren auf einem abgeplatteten Sphäroid. Im Fall von zwei beliebigen Punkten auf der Erdoberfläche ist die Sehnenentfernung zwischen diesen die Länge einer Linie, die durch die dreidimensionale Erde führt, um diese beiden Punkte zu verbinden. Sehnenentfernungen werden in Metern angegeben.
Vorsicht:
Achten Sie darauf, Ihre Daten zu projizieren, wenn sich der Untersuchungsbereich über 30 Grad hinaus erstreckt. Sehnenentfernungen erlauben keine sichere Schätzung von geodätischen Entfernungen über 30 Grad hinaus.
Wenn in der Analyse Sehnenentfernungen verwendet werden, sollte der Parameter Entfernungsband oder Entfernungsschwellenwert (falls angegeben) in Metern angegeben werden.
Für Linien- und Polygon-Features werden bei Entfernungsberechnungen Feature-Schwerpunkte verwendet. Für Multipoints, Polylinien oder Polygone mit mehreren Teilen wird der Schwerpunkt mithilfe des gewichteten arithmetischen Mittelpunkts aller Feature-Teile berechnet. Die Gewichtung für Punkt-Features ist 1, für Linien-Features "Länge" und für Polygon-Features "Fläche".
Das Eingabefeld sollte eine Vielzahl von Werten aufweisen. Für diese Statistikberechnung ist es erforderlich, dass nicht alle Variablen den gleichen Wert aufweisen; eine Berechnung ist z. B. nicht möglich, wenn alle Eingabewerte 1 lauten. Wenn Sie mit diesem Werkzeug das räumliche Muster von Ereignisdaten analysieren möchten, können Sie dazu die Ereignisdaten zusammenfassen. Das Werkzeug Optimierte Hot-Spot-Analyse kann auch zur Analyse des räumlichen Musters von Ereignisdaten verwendet werden.
Hinweis:

Ereignisdaten sind Punkte, die Ereignisse (Verbrechen, Verkehrsunfälle) oder Objekte (Bäume, Geschäfte) darstellen, wobei der Fokus auf der An- oder Abwesenheit und nicht auf ein mit einem Punkt verknüpften gemessenen Attribut liegt.
Ihre Auswahl für den Parameter Konzeptualisierung von räumlichen Beziehungen sollte inhärente Beziehungen unter den Features, die analysiert werden, widerspiegeln. Je realistischer Sie modellieren können, wie Features im Raum interagieren, desto genauer werden die Ergebnisse. Empfehlungen werden unter Auswählen einer Konzeptualisierung räumlicher Beziehungen: Empfehlungen beschrieben. Weitere Tipps:
- Festes Entfernungsband
  Entfernungsband oder Entfernungsschwellenwert wird verwendet, um sicherzustellen, dass jedes Feature mindestens einen Nachbarn hat. Das ist wichtig, jedoch ist dieser Standardwert häufig nicht die am besten geeignete Entfernung für die Analyse. Zusätzliche Strategien, mit deren Hilfe Sie einen geeigneten Maßstab (ein Entfernungsband) für die Analyse ermitteln können, werden unter Auswählen eines Wertes für ein festes Entfernungsband dargestellt.
- Inverse Entfernung oder Inverse quadratische Entfernung
  Wird für den Parameter Entfernungsband oder Entfernungsschwellenwert 0 eingegeben, werden alle Features als Nachbarn aller anderen Features betrachtet. Wenn dieser Parameter leer bleibt, wird die Standardentfernung angewendet.
  Gewichtungen für Entfernungen von weniger als 1 werden instabil, wenn sie umgekehrt werden. Demzufolge wird der Gewichtung für Features, deren Entfernung weniger als 1 Entfernungseinheit beträgt, ein Wert von 1 zugewiesen.
  Bei den Optionen für die inverse Entfernung (Inverse Entfernung, Inverse quadratische Entfernung oder Indifferenzbereich) wird allen lagegleichen Punkten eine Gewichtung von 1 zugewiesen, um eine Nulldivision zu vermeiden. Damit wird sichergestellt, dass keine Features aus der Analyse ausgeschlossen werden.
Zusätzliche Optionen für den Parameter Konzeptualisierung von räumlichen Beziehungen, einschließlich Raum-Zeit-Beziehungen, sind über das Werkzeug Räumliche Gewichtungsmatrix erstellen verfügbar. Um diese zusätzlichen Optionen zu nutzen, konstruieren Sie eine Datei mit der räumlichen Gewichtungsmatrix vor der Analyse. Wählen Sie Räumliche Gewichtungen aus Datei übernehmen als Parameter Konzeptualisierung von räumlichen Beziehungen aus und geben Sie für den Parameter Gewichtungsmatrix-Datei den Pfad zur erstellten Datei mit der räumlichen Gewichtung an.
Weitere Informationen zur Raum-Zeit-Cluster-Analyse finden Sie in der Dokumentation zu Raum/Zeit-Analysen.
Sie können Karten-Layer verwenden, um die Eingabe-Feature-Class zu definieren. Beim Verwenden eines Layers mit einer Auswahl sind nur die ausgewählten Features in der Analyse enthalten.
Wenn Sie eine Gewichtungsmatrix-Datei mit einer .swm-Erweiterung bereitstellen, wird von diesem Werkzeug eine Datei mit räumlicher Gewichtungsmatrix erwartet, die mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen erstellt wurde. Andernfalls wird von diesem Werkzeug eine Datei mit räumlicher Gewichtungsmatrix im ASCII-Format erwartet. Das Verhalten variiert in Abhängigkeit davon, welche Art von Datei mit der räumlichen Gewichtungsmatrix Sie verwenden:
- Dateien mit der räumlichen Gewichtungsmatrix im ASCII-Format:
  - Gewichtungen werden unverändert verwendet. Fehlende Feature-zu-Feature-Beziehungen werden als Nullen behandelt.
  - Wenn die Gewichtungen reihenstandardisiert sind, sind die Ergebnisse für Analysen von Auswahlsätzen mit hoher Wahrscheinlichkeit fehlerhaft. Wenn Sie die Analyse für einen Auswahlsatz ausführen müssen, konvertieren Sie die ASCII-Datei mit den räumlichen Gewichtungen in eine SWM-Datei, indem Sie die ASCII-Daten in eine Tabelle einlesen und dann die Option Tabelle konvertieren mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen verwenden.
- SWM-formatierte Matrixdatei für räumliche Gewichtung:
  - Wenn die Gewichtungen reihenstandardisiert sind, werden sie für die Auswahlsätze erneut reihenstandardisiert; ansonsten werden die Gewichtungen unverändert verwendet.
Das Ausführen der Analyse mit einer Datei mit der räumlichen Gewichtungsmatrix im ASCII-Format erfordert mehr Arbeitsspeicher. Ziehen Sie bei Analysen für mehr als 5.000 Features die Konvertierung Ihrer ASCII-formatierten räumlichen Gewichtungsmatrix-Datei in eine SWM-formatierte Datei in Betracht. Fügen Sie als Erstes die ASCII-Gewichtungen in eine formatierte Tabelle ein (z. B. eine Excel-Tabelle). Führen Sie als Nächstes das Werkzeug Räumliche Gewichtungsmatrix erstellen mit der Option Tabelle konvertieren für den Parameter Konzeptualisierung von räumlichen Beziehungen aus. Die Ausgabe ist eine SWM-formatierte Datei mit räumlicher Gewichtungsmatrix.
Die Ausgabe-Feature-Class wird dem Inhaltsverzeichnis automatisch mit Standard-Rendering für das COType-Feld hinzugefügt. Das Rendering wird durch eine Layer-Datei in <ArcGIS Pro>\Resources\ArcToolBox\Templates\Layers definiert. Sie können das Standard-Rendering nach Bedarf erneut anwenden, indem Sie das Werkzeug Symbolisierung aus Layer anwenden verwenden.
Die Ausgabe-Feature-Class enthält ein SOURCE_ID-Feld, das Ihnen bei Bedarf das Verbinden mit der Eingabe-Feature-Class ermöglicht.
Das Hilfethema Modellierungen räumlicher Beziehungen enthält weitere Informationen zu den Parametern dieses Werkzeugs.

Vorsicht:

Denken Sie beim Verwenden von Shapefiles daran, dass diese keine NULL-Werte speichern können. Werkzeuge oder andere Verfahren zur Erstellung von Shapefiles aus Nicht-Shapefile-Eingaben speichern oder interpretieren NULL-Werte möglicherweise als Wert 0. In manchen Fällen werden NULL-Werte in Shapefiles als sehr große negative Werte gespeichert. Dies kann zu unerwarteten Ergebnissen führen. Weitere Informationen finden Sie unter Überlegungen zur Geoverarbeitung für die Shapefile-Ausgabe.

Wenn dieses Werkzeug in Python-Skripten verwendet wird, stellt das durch die Werkzeugausführung zurückgegebene Ergebnisobjekt die folgenden Ausgaben bereit:


Position	Beschreibung	Datentyp
0	Ausgabe-Feature-Class	Feature-Class
1	Name des Indexfeldes	Feld
2	Name des ZScore-Feldes	Feld
3	Name des Wahrscheinlichkeitsfeldes	Feld
4	Name des COType-Feldes	Feld
5	Name des Quellen-ID-Feldes	Feld

Parameter

Beschriftung	Erläuterung	Datentyp
Eingabe-Feature-Class	Die Feature-Class, für die die Cluster- und Ausreißer-Analyse durchgeführt wird.	Feature Layer
Eingabefeld	Das Zahlenfeld, das ausgewertet werden soll.	Field
Ausgabe-Feature-Class	Die Ausgabe-Feature-Class zum Empfangen der Ergebnisfelder.	Feature Class
Konzeptualisierung von räumlichen Beziehungen	Gibt an, wie räumliche Beziehungen zwischen Features definiert werden. Inverse Entfernung—Nahe gelegene benachbarte Features haben einen größeren Einfluss auf die Berechnungen für ein Ziel-Feature als Features, die weiter weg liegen. Inverse Entfernung im Quadrat—Entspricht Inverse Entfernung, aber aufgrund einer stärkeren Neigung fällt der Einfluss schneller ab. Nur die Nachbarn in direkter Nähe eines Ziel-Features haben dann merklichen Einfluss auf die Berechnungen für dieses Feature. Festes Entfernungsband—Jedes Feature wird im Kontext benachbarter Features analysiert. Benachbarte Features innerhalb der angegebenen kritischen Entfernung (Entfernungsband oder Entfernungsschwellenwert) erhalten eine Gewichtung von 1 und beeinflussen die Berechnungen für das Ziel-Feature. Benachbarte Features außerhalb der kritischen Entfernung erhalten eine Gewichtung von 0 und haben keinen Einfluss auf die Berechnungen eines Ziel-Features. Indifferenzzone—Features innerhalb der angegebenen kritischen Entfernung (Entfernungsbereich oder Schwellenwertabstand) eines Ziel-Feature erhalten eine Gewichtung von 1 und beeinflussen die Berechnungen für das Ziel-Feature. Sobald die kritische Entfernung überschritten wird, nimmt die Gewichtung (und somit der Einfluss eines benachbarten Features auf die Berechnung von Ziel-Features) mit der Entfernung ab. Nächste Nachbarn (K)—Die nächstgelegenen k Features werden in die Analyse einbezogen. Die Anzahl der Nachbarn (k) wird durch den Parameter Anzahl der Nachbarn angegeben. Nur benachbarte Kanten—Nur benachbarte Polygon-Features mit einer gemeinsamen Grenze oder mit einer Überlappung beeinflussen Berechnungen für das Ziel-Polygon-Feature. Benachbarte Kanten/Ecken—Polygon-Features mit einer gemeinsamen Grenze, einem gemeinsamen Knoten oder mit einer Überlappung beeinflussen Berechnungen für das Zielpolygon-Feature. Räumliche Gewichtungen aus Datei abrufen—Räumliche Beziehungen werden durch eine Datei mit räumlichen Gewichtungen definiert. Der Pfad zur Datei mit räumlichen Gewichtungen wird durch den Parameter Gewichtungsmatrix-Datei angegeben.	String
Entfernungsmethode	Gibt an, wie Entfernungen von den einzelnen Features zu benachbarten Features berechnet werden. Euklidisch—Die geradlinige Entfernung zwischen zwei Punkten (die als Luftlinie gemessene Entfernung). Manhattan—Die Entfernung zwischen zwei Punkten, die entlang von rechtwinkligen Achsen gemessen werden (Gebäudeblock). Für die Berechnung werden die (absoluten) Differenzen zwischen den X- und Y-Koordinaten berechnet.	String
Standardisierung	Eine Reihen-Standardisierung wird immer dann empfohlen, wenn die Verteilung der Features aufgrund einer Referenzpunkterfassung oder eines auferlegten Zusammenfassungsschemas möglicherweise verzerrt ist. Keine—Es wird keine Standardisierung räumlicher Gewichtungen angewendet. Reihe—Räumliche Gewichtungen werden standardisiert. Jede Gewichtung wird durch ihre eigene Zeilensumme (die Summe der Gewichtungen aller benachbarten Features) dividiert.	String
Entfernungsband oder Entfernungsschwellenwert (optional)	Gibt einen Entfernungsgrenzwert für Optionen mit inverser Entfernung und Optionen mit fester Entfernung an. Features außerhalb des angegebenen Grenzwerts für ein Ziel-Feature werden in Analysen für dieses Feature ignoriert. Mit der Indifferenzzone wird jedoch der Einfluss von Features außerhalb der angegebenen Entfernung in Abhängigkeit der Entfernung reduziert, während die Features innerhalb des Entfernungsschwellenwerts gleichmäßig berücksichtigt werden. Der eingegebene Entfernungswert sollte dem Ausgabekoordinatensystem entsprechen. Bei Konzeptualisierungen von räumlichen Beziehungen mit inverser Entfernung gibt der Wert 0 an, dass keine Schwellenwertentfernung angewendet wird. Wenn dieser Parameter leer gelassen wird, wird ein Standardschwellenwert berechnet und angewendet. Dieser Standardwert ist die euklidische Entfernung, bei der sichergestellt wird, dass jedes Feature mindestens einen Nachbarn hat. Dieser Parameter hat keine Auswirkung, wenn räumliche Konzeptualisierungen vom Typ "Polygonnachbarschaft" oder "Abrufen von räumlichen Gewichtungen aus Datei" ausgewählt werden.	Double
Gewichtungsmatrix-Datei (optional)	Der Pfad zu einer Datei mit Gewichtungen, die räumliche und potenziell zeitliche Beziehungen unter Features definieren.	File
FDR-Korrektur anwenden (False Discovery Rate) (optional)	Gibt an, ob die statistische Signifikanz mit oder ohne FDR-Korrektur bewertet wird. Aktiviert: Statistische Signifikanz basiert auf der FDR-Korrektur (False Discovery Rate) für ein Konfidenzniveau von 95 Prozent. Deaktiviert: Features mit p-Werten von weniger als 0,05 werden im COType -Feld angezeigt, das statistisch signifikante Cluster oder Ausreißer mit einem Konfidenzniveau von 95 Prozent angibt. Dies ist die Standardeinstellung.	Boolean
Anzahl der Permutationen (optional)	Die Anzahl der zufälligen Permutationen für die Berechnung von Pseudo-p-Werten. Die Standardanzahl der Permutationen ist 499. Bei einer Auswahl von 0 Permutationen wird der Standard-p-Wert berechnet. 0—Es werden keine Permutationen verwendet und ein Standard-p-Wert berechnet. 99—Bei 99 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,01. Alle anderen Pseudo-p-Werte sind Vielfache dieses Wertes. 199—Bei 199 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,005. Alle anderen möglichen Pseudo-p-Werte sind Vielfache dieses Wertes. 499—Bei 499 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,002. Alle anderen Pseudo-p-Werte sind Vielfache dieses Wertes. 999—Bei 999 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,001. Alle anderen Pseudo-p-Werte sind Vielfache dieses Wertes. 9999—Bei 9999 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,0001. Alle anderen Pseudo-p-Werte sind Vielfache dieses Wertes.	Long
Anzahl der Nachbarn (optional)	Die Anzahl der Nachbarn, die in die Analyse einbezogen werden sollen.	Long

Abgeleitete Ausgabe

Beschriftung	Erläuterung	Datentyp
Name des Indexfeldes	Der Name des Indexfeldes.	Feld
Name des ZScore-Feldes	Der Name des Z-Wert-Feldes.	Feld
Wahrscheinlichkeitsfeld	Der Name des Wahrscheinlichkeitsfeldes.	Feld
Cluster-Ausreißertyp	Der Name des Cluster-/Ausreißerfeldes.	Feld
Quell-ID	Der Name des Quell-ID-Feldes.	Feld

arcpy.stats.ClustersOutliers(Input_Feature_Class, Input_Field, Output_Feature_Class, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Weights_Matrix_File}, {Apply_False_Discovery_Rate__FDR__Correction}, {Number_of_Permutations}, {number_of_neighbors})

Name	Erläuterung	Datentyp
Input_Feature_Class	Die Feature-Class, für die die Cluster- und Ausreißer-Analyse durchgeführt wird.	Feature Layer
Input_Field	Das Zahlenfeld, das ausgewertet werden soll.	Field
Output_Feature_Class	Die Ausgabe-Feature-Class zum Empfangen der Ergebnisfelder.	Feature Class
Conceptualization_of_Spatial_Relationships	Gibt an, wie räumliche Beziehungen zwischen Features definiert werden. INVERSE_DISTANCE—Nahe gelegene benachbarte Features haben einen größeren Einfluss auf die Berechnungen für ein Ziel-Feature als Features, die weiter weg liegen. INVERSE_DISTANCE_SQUARED—Entspricht INVERSE_DISTANCE, aber aufgrund einer stärkeren Neigung fällt der Einfluss schneller ab. Nur die Nachbarn in direkter Nähe eines Ziel-Features haben dann merklichen Einfluss auf die Berechnungen für dieses Feature. FIXED_DISTANCE_BAND—Jedes Feature wird im Kontext benachbarter Features analysiert. Benachbarte Features innerhalb der angegebenen kritischen Entfernung (Distance_Band_or_Threshold_Distance) erhalten eine Gewichtung von 1 und beeinflussen die Berechnungen für das Ziel-Feature. Benachbarte Features außerhalb der kritischen Entfernung erhalten eine Gewichtung von 0 und haben keinen Einfluss auf die Berechnungen eines Ziel-Features. ZONE_OF_INDIFFERENCE—Features innerhalb der angegebenen kritischen Entfernung (Distance_Band_or_Threshold_Distance) eines Ziel-Feature erhalten eine Gewichtung von 1 und beeinflussen die Berechnungen für das Feature. Sobald die kritische Entfernung überschritten wird, nimmt die Gewichtung (und somit der Einfluss eines benachbarten Features auf die Berechnung von Ziel-Features) mit der Entfernung ab. K_NEAREST_NEIGHBORS—Die nächstgelegenen k Features werden in die Analyse einbezogen. Die Anzahl der Nachbarn (k) wird durch den Parameter number_of_neighbors angegeben. CONTIGUITY_EDGES_ONLY—Nur benachbarte Polygon-Features mit einer gemeinsamen Grenze oder mit einer Überlappung beeinflussen Berechnungen für das Ziel-Polygon-Feature. CONTIGUITY_EDGES_CORNERS—Polygon-Features mit einer gemeinsamen Grenze, einem gemeinsamen Knoten oder mit einer Überlappung beeinflussen Berechnungen für das Zielpolygon-Feature. GET_SPATIAL_WEIGHTS_FROM_FILE—Räumliche Beziehungen werden durch eine Datei mit räumlichen Gewichtungen definiert. Der Pfad zur Datei mit räumlichen Gewichtungen wird durch den Parameter Weights_Matrix_File angegeben.	String
Distance_Method	Gibt an, wie Entfernungen von den einzelnen Features zu benachbarten Features berechnet werden. EUCLIDEAN_DISTANCE—Die geradlinige Entfernung zwischen zwei Punkten (die als Luftlinie gemessene Entfernung). MANHATTAN_DISTANCE—Die Entfernung zwischen zwei Punkten, die entlang von rechtwinkligen Achsen gemessen werden (Gebäudeblock). Für die Berechnung werden die (absoluten) Differenzen zwischen den X- und Y-Koordinaten berechnet.	String
Standardization	Eine Reihen-Standardisierung wird immer dann empfohlen, wenn die Verteilung der Features aufgrund einer Referenzpunkterfassung oder eines auferlegten Zusammenfassungsschemas möglicherweise verzerrt ist. NONE—Es wird keine Standardisierung räumlicher Gewichtungen angewendet. ROW—Räumliche Gewichtungen werden standardisiert. Jede Gewichtung wird durch ihre eigene Zeilensumme (die Summe der Gewichtungen aller benachbarten Features) dividiert.	String
Distance_Band_or_Threshold_Distance (optional)	Gibt einen Entfernungsgrenzwert für Optionen mit inverser Entfernung und Optionen mit fester Entfernung an. Features außerhalb des angegebenen Grenzwerts für ein Ziel-Feature werden in Analysen für dieses Feature ignoriert. Mit der Indifferenzzone wird jedoch der Einfluss von Features außerhalb der angegebenen Entfernung in Abhängigkeit der Entfernung reduziert, während die Features innerhalb des Entfernungsschwellenwerts gleichmäßig berücksichtigt werden. Der eingegebene Entfernungswert sollte dem Ausgabekoordinatensystem entsprechen. Bei Konzeptualisierungen von räumlichen Beziehungen mit inverser Entfernung gibt der Wert 0 an, dass keine Schwellenwertentfernung angewendet wird. Wenn dieser Parameter leer gelassen wird, wird ein Standardschwellenwert berechnet und angewendet. Dieser Standardwert ist die euklidische Entfernung, bei der sichergestellt wird, dass jedes Feature mindestens einen Nachbarn hat. Dieser Parameter hat keine Auswirkung, wenn räumliche Konzeptualisierungen vom Typ "Polygonnachbarschaft" oder "Abrufen von räumlichen Gewichtungen aus Datei" ausgewählt werden.	Double
Weights_Matrix_File (optional)	Der Pfad zu einer Datei mit Gewichtungen, die räumliche und potenziell zeitliche Beziehungen unter Features definieren.	File
Apply_False_Discovery_Rate__FDR__Correction (optional)	APPLY_FDR—Statistische Signifikanz basiert auf der FDR-Korrektur (False Discovery Rate) für ein Konfidenzniveau von 95 Prozent. NO_FDR—Features mit p-Werten von weniger als 0,05 werden im COType-Feld angezeigt, das statistisch signifikante Cluster oder Ausreißer mit einem Konfidenzniveau von 95 Prozent (Standard) angibt.	Boolean
Number_of_Permutations (optional)	Die Anzahl der zufälligen Permutationen für die Berechnung von Pseudo-p-Werten. Die Standardanzahl der Permutationen ist 499. Bei einer Auswahl von 0 Permutationen wird der Standard-p-Wert berechnet. 0—Es werden keine Permutationen verwendet und ein Standard-p-Wert berechnet. 99—Bei 99 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,01. Alle anderen Pseudo-p-Werte sind Vielfache dieses Wertes. 199—Bei 199 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,005. Alle anderen möglichen Pseudo-p-Werte sind Vielfache dieses Wertes. 499—Bei 499 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,002. Alle anderen Pseudo-p-Werte sind Vielfache dieses Wertes. 999—Bei 999 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,001. Alle anderen Pseudo-p-Werte sind Vielfache dieses Wertes. 9999—Bei 9999 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,0001. Alle anderen Pseudo-p-Werte sind Vielfache dieses Wertes.	Long
number_of_neighbors (optional)	Die Anzahl der Nachbarn, die in die Analyse einbezogen werden sollen.	Long

Abgeleitete Ausgabe

Name	Erläuterung	Datentyp
Index_Field_Name	Der Name des Indexfeldes.	Feld
ZScore_Field_Name	Der Name des Z-Wert-Feldes.	Feld
Probability_Field	Der Name des Wahrscheinlichkeitsfeldes.	Feld
Cluster_Outlier_Type	Der Name des Cluster-/Ausreißerfeldes.	Feld
Source_ID	Der Name des Quell-ID-Feldes.	Feld

Codebeispiel

ClustersOutliers – Beispiel 1 (Python-Fenster)

Das folgende Skript veranschaulicht die Verwendung des Werkzeugs ClustersOutliers im Python-Fenster.

import arcpy
arcpy.env.workspace = "c:/data/911calls"
arcpy.ClustersOutliers_stats("911Count.shp", "ICOUNT","911ClusterOutlier.shp",
                             "GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN_DISTANCE", 
                             "NONE","#", "euclidean6Neighs.swm","NO_FDR", 499)

ClustersOutliers – Beispiel 2 (eigenständiges Skript)

Das folgende eigenständige Python-Skript veranschaulicht, wie Sie das Werkzeug ClustersOutliers verwenden.


# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Cluster-Outlier Analysis Tool (Anselin's Local Moran's I)
# Import system modules
import arcpy
# Set property to overwrite outputs if they already exist
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\Data\911Calls"
try:
    # Set the current workspace 
    #  (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace
    # Copy the input feature class and integrate the points to snap
    # together at 500 feet
    # Process: Copy Features and Integrate
    cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp")
    integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")
    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")
    # Add a unique ID field to the count feature class
    # Process: Add Field and Calculate Field
    af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
                     														"NON_NULLABLE", "NON_REQUIRED", "#",
                     														"911Count.shp")
    
    cf = arcpy.CalculateField_management("911Count.shp", "MyID", "!FID!", "PYTHON")
    # Create Spatial Weights Matrix for Calculations
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
                        																											"euclidean6Neighs.swm",
                       																											 "K_NEAREST_NEIGHBORS",
                       															 												"#", "#", "#", 6) 
    # Cluster/Outlier Analysis of 911 Calls
    # Process: Local Moran's I
    clusters = arcpy.ClustersOutliers_stats("911Count.shp", "ICOUNT", 
                      																				  "911ClusterOutlier.shp", 
                        																				"GET_SPATIAL_WEIGHTS_FROM_FILE",
                        																				"EUCLIDEAN_DISTANCE", "NONE",
                       							 													"#", "euclidean6Neighs.swm", "NO_FDR", "499")
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Umgebungen

Aktueller Workspace, Scratch-Workspace, Ausgabe-Koordinatensystem, Geographische Transformationen, Qualifizierte Feldnamen, Ausgabe hat Z-Werte, Standard-Ausgabe-Z-Wert, Z-Auflösung, Z-Toleranz, Ausgabe hat M-Werte, M-Auflösung, M-Toleranz, XY-Auflösung, XY-Toleranz, Zufallszahlengenerator

Sonderfälle

Ausgabe-Koordinatensystem: Die Feature-Geometrie wird vor der Analyse in das Ausgabe-Koordinatensystem projiziert, sodass die Werte für den Parameter Entfernungsband oder Entfernungsschwellenwert zu jenen passen sollten, die im Ausgabe-Koordinatensystem angegeben sind. Alle mathematischen Berechnungen basieren auf dem Raumbezug des Ausgabekoordinatensystems. Wenn das Ausgabekoordinatensystem auf Grad, Minuten und Sekunden basiert, werden geodätische Entfernungen mithilfe von Sehnenentfernungen in Metern geschätzt.

Zufallszahlengenerator: Der verwendete Zufallsgeneratortyp ist stets Mersenne Twister.

Lizenzinformationen

Basic: Ja
Standard: Ja
Advanced: Ja

Zusammenfassung

Abbildung

Verwendung

Vorsicht:

Hinweis:

Vorsicht:

Parameter

Abgeleitete Ausgabe

Abgeleitete Ausgabe

Codebeispiel

Umgebungen

Sonderfälle

Lizenzinformationen

Verwandte Themen

In diesem Thema