Funktionsweise der optimierten Hot-Spot-Analyse

Die Optimierte Hot-Spot-Analyse führt das Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*) mithilfe der Parameter aus, die aus den Eigenschaften der Eingabedaten abgeleitet werden. Auf ähnliche Weise wie die automatische Einstellung einer Digitalkamera Belichtung und Aufnahmeobjekt mit Geländemesswerten abgleicht, um eine(n) geeignete(n) Blende, Belichtungszeit und Fokus zu bestimmen, fragt das Werkzeug Optimierte Hot-Spot-Analyse Ihre Daten ab, um die Einstellungen zur Erzielung optimaler Hot-Spot-Ergebnisse zu ermitteln. Wenn das Dataset mit Eingabe-Features beispielsweise Ereignispunktdaten enthält, aggregiert das Werkzeug die Ereignisse in gewichtete Features. Durch die Verteilung der gewichteten Features ermittelt das Werkzeug einen geeigneten Analysemaßstab. Die in den Ausgabe-Features angegebene statistische Signifikanz wird für Mehrfachtests und räumliche Abhängigkeit durch Anwendung der FDR-Korrekturmethode (False Discovery Rate) automatisch angepasst.

Während der Werkzeugausführung wird jede vom Werkzeug getroffene Entscheidung zur Erzielung bestmöglicher Ergebnisse als Meldung angezeigt, und darunter wird eine Erläuterung der durchgeführten Berechnungen festgehalten.

Wie beim manuellen Modus der Kamera, mit dem Sie die automatischen Einstellungen außer Kraft setzen können, bietet das Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*) die vollständige Kontrolle über sämtliche Parameteroptionen. Durch Ausführung des Werkzeugs Optimierte Hot-Spot-Analyse und unter Berücksichtigung der Parametereinstellungen, die es verwendet, können Sie die Parameter optimieren, die Ihnen die vollständige Kontrolle über das Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*) ermöglichen.

Der Workflow für das Werkzeug Optimierte Hot-Spot-Analyse beinhaltet die unten beschriebenen Komponenten. Die in den Komponenten verwendeten Berechnungen und Algorithmen sind ebenfalls aufgeführt.

Erste Datenbewertung

In dieser Komponente werden die Eingabe-Features und das optionale Analysefeld, Umgebende Polygone, die den räumlichen Geltungsbereich für Ereignisse definieren und Methode für die Aggregation der Ereignisdaten untersucht, um sicherzustellen, dass genügend Features vorhanden sind und die zu analysierenden Werte eine angemessene Variation aufweisen. Wenn das Werkzeug Datensätze mit beschädigter oder fehlender Geometrie erkennt oder ein Analysefeld angegeben wird und NULL-Werte vorhanden sind, werden die verknüpften Datensätze als falsche Datensätze aufgelistet und aus der Analyse ausgeschlossen.

Das Werkzeug Optimierte Hot-Spot-Analyse verwendet die Getis-Ord Gi*-Statistik (wird Gee Eye Star ausgesprochen) und die Ergebnisse sind, ähnlich wie bei vielen statistischen Methoden, nicht zuverlässig, wenn weniger als 30 Features vorhanden sind. Wenn Sie Polygon-Eingabe-Features oder Punkt-Eingabe-Features und ein Analysefeld verwenden, benötigen Sie mindestens 30 Features, um dieses Werkzeug zu verwenden. Die Mindestanzahl der Polygone zum Aggregieren von Ereignissen in Anzahlwerte beträgt ebenfalls 30. Die Feature-Layer, die umgebende Polygone, die den räumlichen Geltungsbereich für Ereignisse definieren, darstellen, können ein oder mehrere Polygone umfassen.

Für die Gi*-Statistik muss jedes analysierte Feature mit Werten verknüpft sein. Wenn die von Ihnen bereitgestellten Eingabe-Features Ereignisdaten darstellen (wenn Sie kein Analysefeld bereitstellen), aggregiert das Werkzeug die Ereignisse und die Ereignisanzahl dient als Wert für die Analyse. Da nach Abschluss der Aggregation noch mindestens 30 Features vorhanden sein müssen, müssen Sie bei Ereignisdaten mit mehr als 30 Features beginnen. In der folgenden Tabelle ist die Mindestanzahl der Features für jede Methode für die Aggregation der Ereignisdaten dokumentiert:

Mindestanzahl der EreignisseAggregationsmethodeAnzahl der Features nach der Aggregation

60

Ereignisse in Netzgittern zählen und Ereignisse in Hexagongittern zählen, ohne Umgebende Polygone, die den räumlichen Geltungsbereich für Ereignisse definieren anzugeben.

30

30

Ereignisse in Netzgittern zählen und Ereignisse in Hexagongittern zählen, wenn Sie eine Feature-Class für den Parameter Umgebende Polygone, die den räumlichen Geltungsbereich für Ereignisse definieren angeben

30

30

Ereignisse in Aggregationspolygonen zählen

30

60

Nahe gelegene Ereignisse aggregieren, um gewichtete Punkte zu erstellen

30

Die Gi*-Statistik wurde außerdem für ein Analysefeld mit einer Reihe von unterschiedlichen Werten konzipiert. Die Statistik ist beispielsweise nicht für Binärdaten geeignet. Das Werkzeug Optimierte Hot-Spot-Analyse überprüft das Analysefeld, um sicherzustellen, dass die Werte zumindest eine gewisse Variation aufweisen.

Positions-Ausreißer sind Features, die viel weiter entfernt von benachbarten Features sind als die meisten Features im Dataset. Stellen Sie sich eine städtische Umgebung mit großen, dicht besiedelten Städten in der Mitte und kleineren, weniger dicht besiedelten Städten an der Peripherie vor. Bei der Berechnung der durchschnittlichen Entfernung zum nächsten Nachbarn würden Sie feststellen, dass das Ergebnis kleiner ausfällt, wenn Sie die Positions-Ausreißer in der Peripherie ausschließen und sich nur auf die Städte im Kerngebiet konzentrieren. Dies ist ein Beispiel dafür, welche signifikanten Auswirkungen Positions-Ausreißer auf räumliche Statistiken wie Mittlerer nächster Nachbar haben können. Da das Werkzeug Optimierte Hot-Spot-Analyse die Berechnungen für den durchschnittlichen und mittleren nächsten Nachbarn zur Aggregation und zum Identifizieren eines geeigneten Analysemaßstabs verwendet, identifiziert die Komponente "Erste Datenbewertung" des Werkzeugs alle Positions-Ausreißer, die Eingabe-Features oder Polygone zum Aggregieren von Ereignissen in Anzahlwerte umfassen, und meldet die erkannte Anzahl. Dazu berechnet das Werkzeug für jedes Feature die durchschnittliche Entfernung zum nächsten Nachbarn und wertet die Verteilung aller Entfernungen aus. Features mit einer mehr als dreifachen Standardabweichungsentfernung vom nächstgelegenen nicht lagegleichen Nachbarn gelten als Positions-Ausreißer.

Ereignisaggregation

Handelt es sich um Ereignisdaten, werden Ihre Daten von der nächsten Komponente im Workflow aggregiert. Es gibt drei mögliche Ansätze, die von der ausgewählten Methode für die Aggregation der Ereignisdaten abhängen. Die Algorithmen für diese Ansätze werden nachfolgend beschrieben.

  • Ereignisse in Netzgittern zählen oder Ereignisse in Hexagongittern zählen:
    1. Blenden Sie lagegleiche Punkte aus, woraus sich ein einzelner Punkt an jeder eindeutigen Position im Dataset ergibt, indem Sie dieselbe Methode anwenden, die vom Werkzeug Ereignisse erfassen bereitgestellt wird.
    2. Vergleichen Sie die Dichte der N Eingabe-Features mit der Dichte der zufälligen N Features basierend auf dem minimalen umgebenden Polygon der Eingabe-Features (in geodätischen Metern). Die durchschnittliche Entfernung zum nächsten Nachbarn für einen zufälligen Satz an N Punkten im minimalen umgebenden Polygon wird berechnet. Wenn die doppelte durchschnittliche Entfernung zum nächsten Nachbarn für die zufällige Feature-Verteilung geringer ist als die maximale Ausdehnung des Untersuchungsgebiets geteilt durch 100, wird das Dataset als dicht betrachtet. Die Zellengröße des Gitters entspricht in dem Fall der maximalen Ausdehnung geteilt durch 100.
    3. Wenn das Dataset gemäß der obigen Methode nicht als dicht betrachtet wird, beträgt die verwendete Entfernung für die Zellengröße das Zweifache der durchschnittlichen bzw. mittleren Entfernung zum nächsten Nachbarn. Die durchschnittliche Entfernung zum nächsten Nachbarn (ANN, Average Nearest Neighbor) für alle eindeutigen Positionspunkte, mit Ausnahme von Positions-Ausreißern, wird berechnet, indem die Entfernung zum nächsten Nachbarn der einzelnen Features addiert und durch die Anzahl der Features dividiert wird. Die mittlere Entfernung zum nächsten Nachbarn (MNN, Median Nearest Neighbor) wird berechnet, indem die Entfernungen zum nächsten Nachbarn vom kleinsten zum größten Wert sortiert und die Entfernung in der Mitte der sortierten Liste ausgewählt wird (auch mit Ausnahme von Positions-Ausreißern). Der größere Abstand (ANN oder MNN) wird mit 2 multipliziert und als Zellengröße des Gitters verwendet.
    4. Erstellen Sie ein Netz- oder Hexagonpolygongitter, indem Sie die optimierte Zellengröße verwenden und das Gitter mit den Ereignispunkten überlagern.
    5. Ermitteln Sie die Anzahl der Ereignisse in jeder Polygon-Zelle.
    6. Wenn Sie Umgebende Polygone, die den räumlichen Geltungsbereich für Ereignisse definieren angeben, werden alle Polygonzellen innerhalb des umgebenden Polygons beibehalten. Wenn Sie nicht Umgebende Polygone, die den räumlichen Geltungsbereich für Ereignisse definieren angeben, werden Polygonzellen ohne Ereignisse entfernt.
    7. Wenn die Aggregation weniger als 30 Polygonzellen ergibt oder die Anzahl in allen Polygonzellen identisch ist, werden Sie in einer Meldung darauf hingewiesen, dass die von Ihnen bereitgestellten Eingabe-Features für die ausgewählte Methode für die Aggregation der Ereignisdaten nicht geeignet sind. Andernfalls wird die Aggregationskomponente für diese Methode erfolgreich ausgeführt.
  • Ereignisse in Netz-Polygongittern zählen:
    1. Für diese Methode für die Aggregation der Ereignisdaten ist der Feature-Layer Polygone zum Aggregieren von Ereignissen in Anzahlwerte erforderlich. Diese Aggregationspolygone überlagern die Ereignispunkte.
    2. Ermitteln Sie die Anzahl der Ereignisse in jedem Polygon.
    3. Stellen Sie sicher, dass die Ereignisanzahl für Analysezwecke eine hinreichende Variation aufweist. Wenn die Aggregation dazu führt, dass alle Polygone dieselbe Anzahl von Ereignissen aufweisen, werden Sie in einer Meldung darauf hingewiesen, dass die Daten für die ausgewählte Methode für die Aggregation der Ereignisdaten nicht geeignet sind.
  • Nahe gelegene Ereignisse aggregieren, um gewichtete Punkte zu erstellen:
    1. Blenden Sie lagegleiche Punkte aus, woraus sich ein einzelner Punkt an jeder eindeutigen Position im Dataset ergibt, indem Sie dieselbe Methode anwenden, die vom Werkzeug Ereignisse erfassen bereitgestellt wird. Ermitteln Sie die Anzahl der eindeutigen Positions-Features (UL, Unique Location).
    2. Berechnen Sie die durchschnittliche und mittlere Entfernung zum nächsten Nachbarn für alle eindeutigen Positionspunkte, mit Ausnahme von Positions-Ausreißern. Die durchschnittliche Entfernung zum nächsten Nachbarn (ANN, Average Nearest Neighbor) wird berechnet, indem die Entfernung zum nächsten Nachbarn der einzelnen Features addiert und durch die Anzahl der Features dividiert wird. Die mittlere Entfernung zum nächsten Nachbarn (MNN, Median Nearest Neighbor) wird berechnet, indem die Entfernungen zum nächsten Nachbarn vom kleinsten zum größten Wert sortiert und die Entfernung in der Mitte der sortierten Liste ausgewählt wird.
    3. Legen Sie die anfängliche Fangentfernung (SD, Snap Distance) auf ANN oder MNN fest, je nachdem welcher Wert kleiner ist.
    4. Passen Sie die Fangentfernung unter Einbeziehung der lagegleichen Punkte an. Skalar = (UL/N), wobei N die Anzahl der Features im Layer Eingabe-Features angibt. Die angepasste Fangentfernung wird zu SD * Skalar.
    5. Integrieren Sie die Ereignispunkte in drei Schritten, indem Sie zuerst die mit 0,10 multiplizierte angepasste Fangentfernung, dann die mit 0,25 multiplizierte angepasste Fangentfernung verwenden und schließlich in eine Fangentfernung integrieren, die der vollständig angepassten Fangentfernung entspricht. Wenn Sie den Integrationsschritt in drei Durchgängen ausführen, wird die Verzerrung der ursprünglichen Punktpositionen minimiert.
    6. Blenden Sie die gefangenen Punkte aus, woraus sich ein einzelner Punkt an jeder Position mit einer Gewichtung ergibt, um die Anzahl der zusammen gefangenen Ereignisse anzugeben Dieser Teil der Aggregationsverarbeitung verwendet die Methode Ereignisse erfassen.
    7. Wenn die Aggregationsverarbeitung mehr als 30 gewichtete Punkte ergibt oder die Anzahl für alle Punkte identisch ist, werden Sie in einer Meldung darauf hingewiesen, dass die von Ihnen bereitgestellten Eingabe-Features für die ausgewählte Methode für die Aggregation der Ereignisdaten nicht geeignet sind. Andernfalls wird die Aggregationskomponente für diese Methode erfolgreich abgeschlossen.

Analysemaßstab

Diese nächste Komponente des Workflows Optimierte Hot-Spot-Analyse wird auf gewichtete Features angewendet, da Sie entweder Eingabe-Features mit einem Analysefeld angegeben haben oder weil die Methode für die Aggregation der Ereignisdaten Gewichtungen aus der Ereignisanzahl erstellt hat. Der nächste Schritt besteht darin, einen geeigneten Analysemaßstab zu ermitteln. Der ideale Analysemaßstab ist eine Entfernung, die zum Maßstab der Frage in Beziehung stehen sollte, die Sie stellen (falls Sie nach Hot-Spots des Ausbruchs einer Krankheit suchen und wissen, dass der Moskito-Vektor einen Bereich von 10 Meilen aufweist, wäre beispielsweise die Verwendung einer Entfernung von 10 Meilen geeignet). Ist es Ihnen nicht möglich, eine bestimmte Entfernung für den Analysemaßstab zu bestimmen, stehen Ihnen hierzu einige hilfreiche Strategien zur Verfügung. Diese Strategien werden vom Werkzeug Optimierte Hot-Spot-Analyse verwendet.

Als erstes kommt die Strategie "Inkrementelle räumliche Autokorrelation" zur Anwendung. Immer dann, wenn Sie eine räumliche Cluster-Bildung in der Landschaft sehen, sehen Sie einen Beweis für die zugrunde liegenden räumlichen Prozesse, die im Gange sind. Das Werkzeug Inkrementelle räumliche Autokorrelation führt die Methode Global Morans I-Statistik für eine Reihe von ansteigenden Entfernungen aus, wobei die Intensität der räumlichen Cluster-Bildung für jede Entfernung gemessen wird. Positions-Ausreißer werden aus den Berechnungen der Anfangsentfernung und Entfernungsschrittgröße, die in "Inkrementelle räumliche Autokorrelation" verwendet werden, ausgeschlossen. Die Intensität der Cluster-Bildung wird durch den zurückgegebenen Z-Wert bestimmt. In der Regel erhöht sich bei der Erhöhung der Entfernung auch der Z-Wert, was auf eine Intensivierung der Cluster-Bildung hinweist. An einer bestimmten Entfernung erreicht der Z-Wert in der Regel den Spitzenwert. Spitzenwerte stellen Entfernungen dar, bei der die räumlichen Prozesse, die eine Cluster-Bildung fördern, am stärksten sind. Das Werkzeug Optimierte Hot-Spot-Analyse ermittelt mithilfe von Inkrementelle räumliche Autokorrelation Spitzenentfernungen. Wenn eine Spitzenentfernung gefunden wurde, wird diese Entfernung zum Analysemaßstab. Wenn mehrere Spitzenentfernungen gefunden werden, wird die erste Spitzenentfernung ausgewählt.

Wenn keine Spitzenentfernung gefunden wird, überprüft die Optimierte Hot-Spot-Analyse die räumliche Verteilung der Features und berechnet die durchschnittliche Entfernung, die zu K Nachbarn für jedes Feature führt. K wird wie folgt berechnet: 0,05 * N, wobei N die Anzahl der Features im Layer Eingabe-Features angibt. K wird so angepasst, dass es niemals kleiner als 3 oder größer als 30 ist. Wenn die durchschnittliche Entfernung, die K Nachbarn ergibt, eine Standardentfernung überschreitet, wird der Analysemaßstab auf eine Standardentfernung festgelegt; andernfalls spiegelt sie die durchschnittliche Entfernung zu K Nachbarn wider.

Bei dichten Datasets kann die Ausführung von Inkrementelle räumliche Autokorrelation viel Zeit in Anspruch nehmen. Wenn ein Feature mit 500 oder mehr Nachbarn auftritt, wird demzufolge die inkrementelle Analyse übersprungen und die durchschnittliche Entfernung, die 30 Nachbarn ergibt, wird berechnet und als Analysemaßstab verwendet.

Die Entfernung, die den Analysemaßstab widerspiegelt, wird während der Ausführung des Werkzeugs als Meldungen angezeigt und zur Durchführung der Hot-Spot-Analyse verwendet. Diese Entfernung entspricht dem Parameter Entfernungsband oder Entfernungsschwellenwert, das vom Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*) verwendet wird.

Hot-Spot-Analyse

An diesem Punkt des Workflows Optimierte Hot-Spot-Analyse sind alle Überprüfungen und Parametereinstellungen abgeschlossen. Der nächste Schritt besteht darin, die Getis-Ord Gi*-Statistik auszuführen. Weitere Informationen zur Mathematik hinter dieser Statistik finden Sie unter Funktionsweise der Hot-Spot-Analyse (Getis-Ord Gi*). Die Ergebnisse der Gi*-Statistik werden für Mehrfachtests und räumliche Abhängigkeit mithilfe der FDR-Korrekturmethode (False Discovery Rate) automatisch korrigiert. Meldungen, die während der Ausführung des Werkzeugs geschrieben werden, fassen die Anzahl der Features, die als statistisch signifikante Hot- oder Cold-Spots identifiziert wurden, zusammen, nachdem die FDR-Korrektur angewendet wurde.

Ausgabe

Mit der letzten Komponente des Werkzeugs Optimierte Hot-Spot-Analyse werden Ausgabe-Features erstellt. Wenn die Eingabe-Features Ereignisdaten darstellen, die eine Aggregation erfordern, spiegeln die Ausgabe-Features die aggregierten gewichteten Features (Netz- oder Hexagonpolygonzellen oder die Aggregationspolygone, die Sie für den Parameter Polygone zum Aggregieren von Ereignissen in Anzahlwerte angegeben haben, oder gewichtete Punkte) wider. Jedes Feature hat einen Z-Wert, p-Wert, ein Gi Bin-Ergebnis und die Anzahl von Nachbarn, die von jedem Feature in die Berechnungen eingeschlossen wurden.

Zusätzliche Ressourcen

Getis, A. und J.K. Ord. 1992. "The Analysis of Spatial Association by Use of Distance Statistics" in Geographical Analysis 24(3).

Ord, J.K. and A. Getis. 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" in Geographical Analysis 27(4).

Auf der Seite Spatial Statistics Resources werden kurze Videos, Lernprogramme, Online-Seminare, Artikel und eine Vielzahl anderer Materialien zur Verfügung gestellt, die Ihnen den Einstieg in räumliche Statistiken erleichtern.