Funktionsweise der Analyse eines räumlichen Clusters mit mehreren Entfernungen (Ripleys K Function)

Das Werkzeug Analyse eines räumlichen Clusters mit mehreren Entfernungen das auf Ripleys K-Funktion basiert, ist eine weitere Möglichkeit zur Analyse des räumlichen Musters von Punktdaten von Ereignissen. Ein Unterscheidungsmerkmal dieser Methode von anderen Methoden in diesem Toolset (Räumliche Autokorrelation und Hot-Spot-Analyse) ist, dass sie die räumliche Abhängigkeit (Feature-Cluster-Bildung oder Feature-Streuung) über einem Bereich von Entfernungen zusammenfasst. In vielen Feature-Musteranalysestudien ist die Auswahl eines entsprechenden Analysemaßstabs erforderlich. Häufig wird beispielsweise ein Entfernungsband oder eine Schwellenwertentfernung benötigt. Beim Betrachten von räumlichen Mustern bei mehreren Entfernungen und räumlichen Maßstäben ändern sich Muster, wodurch häufig die Dominanz bestimmter räumlicher Prozesse bei der Arbeit dargestellt wird. Die K-Funktion von Ripley stellt dar, wie sich die räumliche Cluster-Bildung oder die Streuung von Feature-Schwerpunkten ändert, wenn sich die Nachbarschaftsgröße ändert.

Wenn Sie dieses Werkzeug verwenden, geben Sie die Anzahl der auszuwertenden Entfernungen und optional eine Startentfernung und/oder eine Entfernungsschrittweite an. Anhand dieser Informationen berechnet das Werkzeug die durchschnittliche Anzahl von benachbarten Features, die mit den einzelnen Features verknüpft sind; bei benachbarten Features ist die Entfernung kürzer als die berechnete Entfernung. Mit Zunahme der Auswertungsentfernung erhält jedes Feature in der Regel mehr Nachbarn. Wenn die durchschnittliche Anzahl von Nachbarn für eine bestimmte Auswertungsentfernung im Untersuchungsgebiet höher/größer als die durchschnittliche Konzentration von Features ist, wird die Verteilung bei dieser Entfernung als gruppiert angesehen.

Verwenden Sie dieses Werkzeug, wenn Sie die Cluster-Bildung/Streuung der Features bei anderen Entfernungen (anderen Analysemaßstäben für die Analyse) untersuchen möchten.

Berechnungen

Es wurden eine Reihe von Variationen von Ripleys ursprünglicher K-Funktion vorgeschlagen. Im folgenden Fall wurde eine häufige Transformation der K-Funktion implementiert, die häufig als L(d) bezeichnet wird:

Transformationsgleichung der K-Funktion
Bei der Transformation L(d) entspricht der erwartete K-Wert der Entfernung.

Die Standardwerte für Anfangsentfernung und Entfernungsschrittgröße werden folgendermaßen berechnet:

  • Die Anzahl der Entfernungsbänder ist immer bekannt (der Standardwert ist 10). Dieser Iterationswert wird zum Berechnen einer standardmäßigen Entfernungsschrittgröße verwendet, falls eine solche nicht angegeben ist.
  • Zunächst wird ein maximaler Entfernungswert als 25 Prozent der maximalen Ausdehnungslänge eines minimalen umschließenden Rechteck um die Eingabe-Features berechnet. Wenn die Grenzkorrekturmethode Analysebereich reduzieren lautet, wird als maximale Entfernung 25 Prozent der maximalen Ausdehnungslänge oder 50 Prozent der minimalen Ausdehnungslänge des minimalen umschließenden Rechtecks festgelegt, je nachdem welcher Wert höher ist.
  • Bei Angabe einer Anfangsentfernung ist die Entfernungsschrittgröße (Maximale Entfernung - Anfangsentfernung) / Iterationen.
  • Wenn keine Anfangsentfernung angegeben ist, ist die Entfernungsschrittgröße die maximale Entfernung durch die Anzahl der Iterationen, und als Anfangsentfernung wird der Wert der Entfernungsschrittgröße festgelegt.

Interpretieren von ungewichteten K-Funktionsergebnissen

Wenn der beobachtete K-Wert für eine bestimmte Entfernung größer als der erwartete K-Wert ist, ist die Verteilung stärker gruppiert als eine zufällige Verteilung bei dieser Entfernung (Analysemaßstab). Wenn der beobachtete K-Wert kleiner als der erwartete K-Wert ist, ist die Verteilung stärker gestreut als eine zufällige Verteilung bei dieser Entfernung. Wenn der beobachtete K-Wert größer als der obere Confidence-Envelope-Wert (HiConfEnv) ist, ist die räumliche Cluster-Bildung für diese Entfernung statistisch signifikant. Wenn der beobachtete K-Wert kleiner als der untere Confidence-Envelope-Wert (LwConfEnv) ist, ist die räumliche Streuung für diese Entfernung statistisch signifikant.

Wenn kein Gewichtungsfeld angegeben ist, wird der Confidence Envelope erstellt, indem Punkte im Untersuchungsgebiet zufällig verteilt werden und k für diese Verteilung berechnet wird. Jede zufällige Verteilung der Punkte wird als "Permutation" bezeichnet. Wenn beispielsweise 99 Permutationen ausgewählt wurde, wird der Satz von Punkten vom Werkzeug für jede Iteration 99 Mal nach dem Zufallsprinzip verteilt. Nachdem die Punkte 99 Mal verteilt wurden, wählt das Werkzeug für jede Entfernung den k-Wert, nach oben und unten von dem erwarteten k-Wert abweicht, nach dem größten Betrag aus; diese Werte werden das Vertrauensintervall. Die Confidence Envelopes folgen in der Regel als die blaue erwartete K-Linie für den ungewichteten K-Wert (weise dieselbe Form und Position auf).

Interpretieren von K-Funktionsergebnissen

Interpretieren von gewichteten K-Funktionsergebnissen

Die K-Funktion wertet immer die räumliche Verteilung eines Features im Verhältnis zur zufälligen räumlichen Verteilung (Complete Spatial Randomness, CSR) aus, auch dann, wenn ein Gewichtungsfeld angegeben ist. Die Gewichtungen stellen die Anzahl von lagegleichen Features an den einzelnen Feature-Positionen dar. Ein Feature mit einer Gewichtung von 3 kann beispielsweise als 3 lagegleiche Features interpretiert werden. Es gibt jedoch einen Unterschied: ein Feature kann nicht sein eigener Nachbar sein. Sie würden daher ein anderes Ergebnis für ein Dataset erhalten, wenn 3 einzelne lagegleiche Punkte mit einer Gewichtung von 1 vorhanden sind (alle würde als gegenseitige Nachbarn betrachtet werden), als für ein Dataset mit einem einzelnen Punkt mit einer Gewichtung von 3 (ein Feature wird nicht als Nachbar von sich selbst betrachtet). Ergebnisse aus der gewichteten K-Funktion sind immer stärker gruppiert als Ergebnisse ohne Gewichtungsfeld. Es kann hilfreich sein, die K-Funktion an den Punkten ohne Gewichtung auszuführen, um eine Basislinie zu erhalten, die angibt, welcher Anteil der Cluster-Bildung nur mit Feature-Positionen verknüpft ist. Sie können dann die Basislinie mit gewichteten Ergebnissen vergleichen, um ein Gefühl dafür zu bekommen, wie viel zusätzliche Cluster-Bildung oder Streuung hinzugefügt wird, wenn die Gewichtung berücksichtigt wird. Die gewichtete K-Funktion zeigt die Cluster-Bildung (Streuung) über und unter derjenigen an, die aus einem ungewichteten Muster resultieren würde. Anstelle der zufälligen räumlichen Verteilung können Sie Ergebnisse aus der ungewichteten K-Funktion verwenden, um das erwartete Muster (mit seinem eigenen Confidence Envelope) darzustellen. Es gibt in diesem Fall zwei mögliche Nullhypothesen:

  1. Das Muster gewichteter Features ist nicht wesentlich stärker gruppiert (gestreut) als das zugrunde liegende Muster dieser Features. Die Nullhypothese wird abgelehnt, wenn die beobachteten gewichteten Ergebnisse außerhalb des Confidence Envelopes der ungewichteten Ergebnisse liegen.
  2. Das Muster gewichteter Punkte ist stärker gruppiert (gestreut) als dies bei einer zufälligen Anordnung der Fall wäre. Die Nullhypothese wird abgelehnt, wenn die beobachteten ungewichteten Ergebnisse innerhalb des Confidence Envelopes für die gewichteten K-Funktionsergebnisse liegen.

Wenn ein Gewichtungsfeld angegeben wird, werden nur die Gewichtungswerte zufällig neu verteilt, um Confidence-Envelopes zu berechnen; die Punktpositionen bleiben bestehen. Wenn ein Gewichtungsfeld angegeben wird, bleiben Positionen fixiert und das Werkzeug wertet die Cluster-Bildung von Feature-Werten im Raum aus. Da die Strukturierung der Ergebnisse stark von den festen Positionen der Features abhängig ist, folgt das Confidence Envelope bei gewichteten K-Analysen der roten beobachteten K-Linie bzw. wird daran gespiegelt.

Zusätzliche Quellen

Burgmauer, T. C. und A. C. Gatrell. Interactive Spatial Data Analysis. Longman Scientific & Technical, Harlow, U.K. 395 pp. 1995.

Boots, B. und A. Getis. Point Pattern Analysis. Sage University Paper Series on Quantitative Applications in the Social Sciences, series no. 07–001. Sage Publications. 1988.

Getis, A. Interactive Modeling Using Second-Order Analysis. Environment and Planning A, 16: 173–183. 1984.

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. Esri Press, 2005.