Funktionsweise der Hot-Spot-Analyse (Getis-Ord Gi*)

Mit dem Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*) wird die Getis-Ord Gi*-Statistik (ausgesprochen G-i-Sternchen) für die einzelnen Features eines Datasets berechnet. Anhand der sich ergebenden Z-Werte und p-Werte geben an, wo Features mit hohen oder niedrigen Werten zur räumlichen Cluster-Bildung neigen. Mit diesem Werkzeug werden einzelne Features innerhalb des Kontexts ihrer benachbarten Features ausgewertet. Ein Feature mit einem hohen Wert ist beachtenswert, es muss sich dabei jedoch nicht zwangsweise um einen statistisch signifikanten Hot-Spot handeln. Ein statistisch signifikanter Hot-Spot ist ein Feature mit einem hohen Wert, das von anderen Features mit hohen Werten umgeben ist. Die lokale Summe eines Features und der benachbarten Features wird proportional mit der Summe aller Features verglichen. Wenn die lokale Summe sich erheblich von der erwarteten lokalen Summe unterscheidet und der Unterschied zu groß ist, um von einem willkürlichen Zufall herzurühren, ergibt sich ein statistisch signifikanter Z-Wert. Bei Anwendung der FDR-Korrektur wird die statistische Signifikanz so angepasst, dass Mehrfachtests und räumliche Abhängigkeit einbezogen werden.

Berechnungen

Die Berechnungen für die Getis-Ord Gi*-Statistik sind in der folgenden Abbildung dargestellt:

Die Mathematik hinter der Gi*-Statistik

Interpretation

Der als Gi*-Statistik zurückgegebene Wert jedes Features im Dataset ist ein Z-Wert. Bei statistisch signifikanten, positiven Z-Werten gilt, je höher der Z-Wert, desto dichter ist das Clustering hoher Werte (Hot-Spots). Bei statistisch signifikanten, negativen Z-Werten gilt, je niedriger der Z-Wert, desto dichter ist das Clustering niedriger Werte (Cold-Spots). Weitere Informationen zum Bestimmen der statistischen Signifikanz und zum Korrigieren für Mehrfachtests und räumliche Abhängigkeit finden Sie unter Was ist ein Z-Wert? Was ist ein p-Wert?.

Ausgabe

Mit diesem Werkzeug wird eine neue Ausgabe-Feature-Class mit einem Z-Wert, p-Wert und Konfidenzniveau-Bin (Gi_Bin) für jedes Eingabe-Feature erstellt.

Nach Ausführung dieses Werkzeugs wird die Ausgabe-Feature-Class zu der Karte hinzugefügt, wobei das Rendering auf das Gi_Bin-Feld angewendet wird.

Überlegungen zur Hot-Spot-Analyse

Beachten Sie bei der Ausführung einer Hot-Spot-Analyse Folgendes:

  • Mit dem Werkzeug wird bewertet, ob hohe oder niedrige Werte (z. B. die Anzahl von Straftaten, Unfallschwere oder aufgewendete Geldbeträge für Sportartikel) zur räumlichen Cluster-Bildung neigen. Das Feld mit diesen Werten ist das Analysefeld. Bei Punktereignisdaten sind Sie jedoch möglicherweise eher an der Einschätzung der Intensität eines Ereignisses interessiert und nicht so sehr an der Analyse der räumlichen Cluster-Bildung eines bestimmten Wertes, der mit diesen Ereignissen zusammenhängt. In diesem Fall müssen Sie die Ereignisdaten vor der Analyse zusammenfassen, indem Sie eine der folgenden Methoden anwenden:
    • Wenn das Untersuchungsgebiet Polygon-Features enthält, zählen Sie die Anzahl der Ereignisse in jedem Polygon mit dem Werkzeug Räumliche Verbindung. Das resultierende Feld, das die Anzahl der Ereignisse in jedem Polygon enthält, dient als Parameterwert für das Eingabefeld für das Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*).
    • Erstellen Sie mit dem Werkzeug Netz erstellen oder Mosaik generieren ein Polygon-Gitter über den Punkt-Features. Zählen Sie dann die Anzahl der Ereignisse in jedem Gitter-Polygon mit dem Werkzeug Räumliche Verbindung. Entfernen Sie alle Gitter-Polygone außerhalb des Untersuchungsgebiets. Wenn viele der Gitter-Polygone im Untersuchungsgebiet NULL-Werte als Anzahl der Ereignisse enthalten, vergrößern Sie ggf. die Gittergröße des Polygons oder entfernen Sie diese Gitter-Polygone mit NULL-Wert.
    • Wenn eine Reihe von lagegleichen Punkten oder Punkten, die in geringer Entfernung zu anderen Punkten liegen, vorhanden sind, verwenden Sie das Werkzeug Integrieren mit dem Werkzeug Ereignisse erfassen, um Features mit einer bestimmten Entfernung zueinander zu fangen und eine neue Feature-Class mit einem Punkt an jeder eindeutigen Position mit zugehörigem Anzahl-Attribut zu erstellen, das die Anzahl der Ereignisse (der gefangenen Punkte) enthält. Verwenden Sie das resultierende ICOUNT-Feld als Parameterwert für das Eingabefeld für das Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*).
      Hinweis:

      Wenn es sich bei den lagegleichen Punkten um redundante Datensätze handeln könnte, können Sie Duplikate mit dem Werkzeug Identische finden suchen und entfernen.

    Beispiele für die Verwendung der oben genannten Werkzeuge zur Aggregation von Ereignisdaten sind in der folgenden Abbildung dargestellt:
    Beispiele für die Zusammenfassung von Ereignisdaten
    Strategien zum Zusammenfassen von Ereignisdaten
  • Der empfohlene (und standardmäßig verwendete) Parameterwert Konzeptualisierung von räumlichen Beziehungen für das Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*) ist Festes Entfernungsband. Aber auch die Optionen Raum-Zeit-Fenster, Indifferenzzone, Nächste Nachbarn (K) und Delaunay-Triangulation können möglicherweise verwendet werden. Informationen zu den Empfehlungen und Strategien zum Bestimmen eines Entfernungswertes für die Analyse finden Sie unter Empfehlungen für die Auswahl einer Konzeptualisierung räumlicher Beziehungen und Empfehlungen für die Auswahl eines Wertes für ein festes Entfernungsband. Weitere Informationen zur räumlichen und zeitlichen Hot-Spot-Analyse finden Sie unter Raum-Zeit-Cluster-Analyse.

  • Das Eingabefeld bestimmt, welche Fragen Sie stellen können. Wenn Sie sich besonders dafür interessieren, zu bestimmen, wo viele Ereignisse vorliegen oder wo hohe/niedrige Werte für ein bestimmtes Attribut zur räumlichen Cluster-Bildung neigen, führen Sie das Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*) mit den unverarbeiteten Werten oder der Anzahl der unverarbeiteten Ereignisse aus. Diese Art der Analyse ist vor allem bei Problemen mit der Ressourcenzuteilung hilfreich. Alternativ (oder zusätzlich) können Sie Gebiete mit unerwartet hohen Werten im Vergleich zu einer anderen Variable bestimmen. Wenn Sie etwa Zwangsvollstreckungen analysieren, erwarten Sie ggf. mehr Zwangsvollstreckungen an Orten mit mehr Häusern (das heißt, Sie erwarten, dass die Anzahl der Zwangsvollstreckungen eine Funktion der Anzahl der Häuser darstellt). Wenn Sie die Anzahl der Zwangsvollstreckungen durch die Anzahl der Häuser teilen und dann das Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*) für dieses Verhältnis ausführen, fragen Sie nicht mehr danach, wo es viele Zwangsvollstreckungen gibt. Stattdessen erfragen Sie, wo es im Verhältnis zur Anzahl der Häuser eine unerwartet hohe Anzahl von Zwangsvollstreckungen gibt. Durch die Erstellung einer Rate oder eines Verhältnisses vor der Analyse können Sie überprüfen, ob bestimmte erwartete Beziehungen vorhanden sind (beispielsweise ist die Anzahl der Straftaten eine Funktion der Bevölkerung; die Anzahl der Zwangsvollstreckungen ist eine Funktion der vorhandenen Häuser), und unerwartete Hot-Spots und Cold-Spots identifizieren.

Empfehlungen

Nachfolgend werden Empfehlungen für die Verwendung des Werkzeugs Hot-Spot-Analyse (Getis-Ord Gi*) aufgeführt:

  • Die Eingabe-Feature-Class sollte mindestens 30 Features enthalten. Bei weniger als 30 Features sind die Ergebnisse nicht zuverlässig.
  • Geben Sie einen geeigneten Parameterwert für Konzeptualisierung von räumlichen Beziehungen an. Bei diesem Werkzeug empfiehlt sich die Verwendung der Option Festes Entfernungsband. Informationen zur räumlichen und zeitlichen Hot-Spot-Analyse finden Sie unter Empfehlungen für die Auswahl einer Konzeptualisierung räumlicher Beziehungen.
  • Geben Sie einen geeigneten Parameterwert für Entfernungsband oder Entfernungsschwellenwert an. Weitere Informationen finden Sie unter Entfernungsband oder Entfernungsschwellenwert.
    • Jedes Feature sollte mindestens einen Nachbarn aufweisen.
    • Kein Feature sollte alle anderen Features als Nachbarn haben.
    • Jedes Feature sollt etwa acht Nachbarn haben. Dies gilt insbesondere, wenn die Werte für den Parameterwert Eingabefeld verzerrt sind Sie können das Werkzeug Entfernungsband anhand der Anzahl der Nachbarn berechnen verwenden, um die durchschnittliche Entfernung zu ermitteln, bei der jedes Feature acht Nachbarn aufweist.

Potenzielle Anwendungsbereiche

Das Werkzeug kann zum Beispiel bei der Analyse von Straftaten, Wahlmustern, Einzelhandelsdaten und Verkehrsereignissen oder in der Epidemiologie, ökonomischen Geographie und Demografie eingesetzt werden. Es wird die Beantwortung folgender Fragen ermöglicht:

  • Wo bricht die Krankheit besonders häufig aus?
  • Wo machen Küchenbrände eine höheren Anteil als erwartet von Wohnungsbränden aus?
  • Wo sollten sich die Evakuierungsorte befinden?
  • Wo und wann treten Spitzenwerte auf?
  • An welchen Orten und zu welchen Zeiten sollten Ressourcen zugewiesen werden?

Zusätzliche Quellen

Weitere Informationen zu räumlichen Statistiken finden Sie in den folgenden Ressourcen:

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.

Getis, A. und J.K. Ord. 1992."The Analysis of Spatial Association by Use of Distance Statistics" in Geographical Analysis 24(3).

Ord, J.K. und A. Getis. 1995 "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" in Geographical Analysis 27(4).

Auf der Seite Spatial Statistics Resources werden kurze Videos, Lernprogramme, Online-Seminare, Artikel und eine Vielzahl anderer Materialien zur Verfügung gestellt, die Ihnen den Einstieg in räumliche Statistiken erleichtern.

Scott, L. und N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools in ArcUser Online, April bis Juni 2005.