Trendanalyse von Hot-Spots (Space Time Pattern Mining)

Zusammenfassung

Identifiziert Trends bei der Cluster-Bildung von Punktdichten (Anzahl) oder Werten in einem Raum-Zeit-Würfel, der entweder mit dem Werkzeug Raum-Zeit-Würfel durch Aggregieren von Punkten erstellen, dem Werkzeug Raum-Zeit-Würfel aus definierten Positionen erstellen oder mit dem Werkzeug Raum-Zeit-Würfel aus multidimensionalem Raster-Layer erstellen erstellt wurde. Zu den Kategorien zählen neue, fortlaufende, sich verstärkende, dauerhafte, sich abschwächende, zeitweilige, schwankende und ehemalige Hot- und Cold-Spots.

Weitere Informationen zur Funktionsweise des Werkzeugs Trendanalyse von Hot Spots

Abbildung

Hot-Spot-Trends

Verwendung

  • Dieses Werkzeug akzeptiert ausschließlich netCDF-Dateien, die mit dem Werkzeug Raum-Zeit-Würfel durch Aggregieren von Punkten erstellen, mit dem Werkzeug Raum-Zeit-Würfel aus definierten Positionen erstellen oder mit dem Werkzeug Raum-Zeit-Würfel aus multidimensionalem Raster-Layer erstellen erstellt wurden.

  • Jeder Abschnitt des Raum-Zeit-Würfels enthält die Werte LOCATION_ID, time_step_ID und COUNT sowie alle Zusammenfassungsfelder oder Variablen, die beim Erstellen des Würfels aggregiert wurden. Abschnitte, die derselben physischen Position zugeordnet sind, besitzen dieselbe Positions-ID und stellen zusammen eine Zeitserie dar. Abschnitte, die demselben Zeitintervall zugeordnet sind, besitzen dieselbe Zeitschritt-ID und stellen ein gemeinsames Zeitintervall dar. Der Zählwert für jeden Abschnitt entspricht der Anzahl der Ereignisse oder Datensätze, die innerhalb des zugeordneten Zeitintervalls an der zugeordneten Position entstanden sind.

    Jeder Abschnitt verfügt über eine Positions-ID, eine Zeitschritt-ID und einen Zählwert.

  • Mit diesem Werkzeug wird eine Variable im netCDF-Eingabe-Raum-Zeit-Würfel mit einer Raum-Zeit-Implementierung der Getis-Ord Gi*-Statistik analysiert.

  • Die Ausgabe-Features werden dem Bereich Inhalt zusammen mit einem Rendering, das eine Ergebniszusammenfassung der Raum-Zeit-Analyse für alle analysierten Positionen enthält, hinzugefügt. Wenn Sie eine Polygon-Analysemaske angeben, dann werden nur die Positionen analysiert, die sich innerhalb der Analysemaske befinden. Andernfalls werden diejenigen Positionen analysiert, die mindestens einen Punkt für mindestens ein Zeitintervall enthalten.

    Würfelpositionen mit und ohne Daten.

  • Zusätzlich zu den Ausgabe-Features erscheint während der Ausführung von Werkzeugen unten im Bereich Geoverarbeitung eine Analysezusammenfassung in Form von Meldungen. Sie können auf diese Nachrichten zugreifen, indem Sie mit der Maus auf die Fortschrittsleiste zeigen, auf die Pop-out-Schaltfläche Pop-out klicken oder den Detailabschnitt der Meldungen im Bereich Geoverarbeitung einblenden. Sie können auch auf die Meldungen für ein zuvor ausgeführtes Werkzeug über den Geoverarbeitungsverlauf zugreifen.

  • Mit dem Werkzeug "Trendanalyse von Hot-Spots" lassen sich acht spezifische Hot- oder Cold-Spot-Trends aufspüren: neu, konsekutiv, sich verstärkend, dauerhaft, sich abschwächend, zeitweilig, schwankend und ehemalig. Unter Weitere Informationen zur Funktionsweise des Werkzeugs "Trendanalyse von Hot-Spots" erfahren Sie mehr über Ausgabe-Kategoriedefinitionen sowie Näheres zu den Algorithmen, die in diesem Werkzeug zum Einsatz kommen.

  • Zum Messen der Intensität der Feature-Clusterbildung nutzt dieses Werkzeug eine Raum-Zeit-Implementierung der Getis-Ord Gi*-Statistik, die den Wert für jeden Abschnitt im Zusammenhang mit den Werten für benachbarte Abschnitte berücksichtigt.

  • Um zu bestimmen, welche Abschnitte in der jeweiligen Analyse-Nachbarschaft einbezogen werden müssen, sucht das Werkzeug zunächst nach benachbarten Abschnitten, die innerhalb der angegebenen Konzeptualisierung von räumlichen Beziehungen liegen. Danach berücksichtigt es für jeden dieser Abschnitte an denselben Positionen befindliche Abschnitte aus N vorangegangenen Zeitintervallen, wobei N dem von Ihnen angegebenen Nachbarschaftszeitintervall entspricht.

  • Ihre Auswahl für den Parameter Konzeptualisierung von räumlichen Beziehungen sollte inhärente Beziehungen unter den Features, die analysiert werden, widerspiegeln. Je realistischer Sie modellieren können, wie Features im Raum interagieren, desto genauer werden die Ergebnisse. Empfehlungen werden unter Auswählen einer Konzeptualisierung räumlicher Beziehungen: Empfehlungen beschrieben.

  • Die Standardeinstellung für Konzeptualisierung von räumlichen Beziehungen lautet Festgelegte Entfernung. Ein Abschnitt gilt als Nachbar, wenn sein Schwerpunkt innerhalb der Nachbarschaftsentfernung und sein Zeitintervall innerhalb des angegebenen Nachbarschaftszeitintervalls liegt. Sollten Sie keinen Wert für die Nachbarschaftsentfernung angeben, wird anhand der räumlichen Verteilung Ihrer Punktdaten einer berechnet. Wird für das Nachbarschaftszeitintervall kein Wert vorgegeben, verwendet das Werkzeug den Standardwert 1 als Zeitintervall.

  • Der Parameter Anzahl der Nachbarn kann die Nachbarschaftsentfernung für die Option Festgelegte Entfernung überschreiben oder die Suche nach Nachbarn für die Optionen Nur benachbarte Kanten und Benachbarte Kanten/Ecken erweitern. In diesen Fällen wird Anzahl der Nachbarn als Mindestanzahl verwendet. Wenn Sie beispielsweise Festgelegte Entfernung mit einer Nachbarschaftsentfernung von 10 Meilen festlegen und 3 für den Parameter Anzahl der Nachbarn angeben, erhalten alle Abschnitte mindestens 3 räumliche Nachbarn, selbst wenn die Nachbarschaftsentfernung erhöht werden muss, um sie zu finden. Die Entfernung wird nur für die Abschnitte erhöht, in denen die minimale Anzahl der Nachbarn nicht erreicht wird. Ähnliches gilt für die Nachbarschaftsoptionen: Für Abschnitte mit einer geringeren Anzahl von zusammenhängenden Nachbarn werden zusätzliche Nachbarn anhand der Schwerpunkt-Nachbarschaftsanalyse (Proximity) ausgewählt.

  • Der Wert Nachbarschaftszeitintervall entspricht der Anzahl von Zeitintervallen, die in die Analysenachbarschaft einbezogen werden sollen. Beträgt das Zeitintervall des Würfels beispielsweise drei Monate und Sie geben 2 als Nachbarschaftszeitintervall an, werden alle Abschnittszählungen innerhalb der Nachbarschaftsentfernung sowie alle ihnen zugeordneten Abschnitte für die vorangegangenen Zeitintervalle (die sich über einen Zeitraum von neun Monaten erstrecken) in der Nachbarschaftsanalyse erfasst.

  • Der Feature-Layer Polygon-Analysemaske kann mindestens ein Polygon enthalten, mit dem das Analyse-Untersuchungsgebiet definiert wird. Aus diesen Polygonen sollte hervorgehen, wo Punkt-Features möglicherweise auftreten könnten, und sie sollten Flächen ausschließen, in denen Punkte unmöglich auftreten könnten. Wenn Sie beispielsweise Trends zu Wohnungseinbrüchen untersuchen, sollten Sie die Polygon-Analysemaske verwenden, um große Wasserflächen, lokale Parks oder andere Gebiete auszuschließen, die keine Wohngebiete sind.

  • Die Polygon-Analysemaske wird mit der Ausdehnung des Eingabe-Raum-Zeit-Würfels geschnitten und erweitert nicht die Dimensionen des Würfels.

  • Wenn die Polygon-Analysemaske, mit der Sie das Untersuchungsgebiet festlegen, eine Fläche abdeckt, die über die Ausdehnung der Eingabe-Features hinausgeht, die bei der ersten Erstellung des Würfels herangezogen wurden, können Sie den Würfel mithilfe dieser Polygon-Analysemaske als Ausgabeausdehnungsumgebung neu erstellen. Dadurch wird sichergestellt, dass die gesamte von der Polygon-Analysemaske abgedeckte Fläche beim Ausführen des Werkzeugs "Trendanalyse von Hot-Spots" einbezogen wird. Durch die Verwendung der Polygon-Analysemaske als Einstellung für die Ausgabeausdehnungsumgebung während der Würfelerstellung wird sichergestellt, dass die Ausdehnung des Würfels und die Ausdehnung der Polygon-Analysemaske übereinstimmen.

  • Einige Ergebnisse des Werkzeugs "Trendanalyse von Hot-Spots" gehen anschließend wieder in den netCDF Eingabe-Raum-Zeit-Würfel ein. Es werden drei Analysen durchgeführt:

    • Im Kontext benachbarter Abschnitte wird jeder Abschnitt einer Analyse unterzogen, um die Intensität der Cluster-Bildung sowohl für hohe als auch für niedrige Werte zu messen. Bei dieser Analyse wird ein Z-Wert, ein p-Wert und eine Klasseneinteilungskategorie für jeden Abschnitt des Raum-Zeit-Würfels ausgegeben.
    • Die Zeitserie der in den analysierten Positionen enthaltenen Z-Werte wird dann mithilfe der Mann-Kendall-Statistik ausgewertet. Ergebnis dieser Analyse ist ein den Cluster-Bildungstrend beschreibender Z-Wert, ein p-Wert und eine Klasseneinteilungskategorie für jede Position.
    • Zum Schluss wird die Zeitserie der in den analysierten Positionen enthaltenen Werte mithilfe der Mann-Kendall-Statistik ausgewertet. Ergebnis dieser Analyse ist ein den Trend beschreibender Z-Wert, ein p-Wert und eine Klasseneinteilungskategorie für jede Position.

    Es folgt eine Übersicht der zum Eingabe-Raum-Zeit-Würfel hinzugefügten Variablen:

    VariablennameBeschreibungDimension

    EMERGING_{ANALYSIS_VARIABLE}_HS_PVALUE

    p-Wert der Getis-Ord Gi*-Statistik zur Messung der statistischen Signifikanz der Cluster-Bildung mit hohen Werten (Hot-Spot) und niedrigen Werten (Cold-Spot).

    Dreidimensional: ein p-Wert für jeden Abschnitt des Raum-Zeit-Würfels.

    EMERGING_{ANALYSIS_VARIABLE}_HS_ZSCORE

    Z-Wert der Getis-Ord Gi*-Statistik zur Messung der Intensität der Cluster-Bildung mit hohen Werten (Hot Spot) und niedrigen Werten (Cold Spot).

    Dreidimensional: ein Z-Wert für jeden Abschnitt des Raum-Zeit-Würfels.

    EMERGING_{ANALYSIS_VARIABLE}_HS_BIN

    Ergebniskategorie zur Klassifizierung jedes Abschnitts als statistisch signifikanter Hot-Spot- oder Cold-Spot-Wert. Der Abschnitt basiert auf einer FDR-Korrektur.

    • -3: Cold-Spot, 99 % Sicherheit
    • -2: Cold-Spot, 95 % Sicherheit
    • -1: Cold-Spot, 90 % Sicherheit
    • 0: kein statistisch signifikanter Hot- bzw. Cold-Spot
    • 1: Hot-Spot, 90 % Sicherheit
    • 2: Hot-Spot, 95 % Sicherheit
    • 3: Hot-Spot, 99 % Sicherheit

    Dreidimensional: eine Klasseneinteilungskategorie für jeden Abschnitt des Raum-Zeit-Würfels. Der Abschnitt basiert auf einer FDR-Korrektur.

    {ANALYSIS_VARIABLE}_TREND_PVALUE

    Der p-Wert der Mann-Kendall-Statistik zur Messung der statistischen Signifikanz des Wertetrends an einer Position.

    Zweidimensional: ein p-Wert für jede analysierte Position.

    {ANALYSIS_VARIABLE}_TREND_ZSCORE

    Der Z-Wert zur Messung des den Werten für eine Position zugeordneten Mann-Kendall-Trends (zu- oder abnehmend). Ein positiver Z-Wert verweist auf einen zunehmenden Trend, ein negativer Z-Wert verweist auf einen abnehmenden Trend.

    Zweidimensional: ein Z-Wert für jede analysierte Position.

    {ANALYSIS_VARIABLE}_TREND_BIN

    Ergebniskategorie zur Klassifizierung jeder Position; für die Werte wird ein statistisch signifikanter Aufwärts- bzw. Abwärtstrend ermittelt.

    • -3: Abwärtstrend, 99 % Sicherheit
    • -2: Abwärtstrend, 95 % Sicherheit
    • -1: Abwärtstrend, 90 % Sicherheit
    • 0: kein signifikanter Trend
    • 1: Aufwärtstrend, 90 % Sicherheit
    • 2: Aufwärtstrend, 95 % Sicherheit
    • 3: Aufwärtstrend, 99 % Sicherheit

    Zweidimensional: eine Klasseneinteilungskategorie für jede analysierte Position.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_PVALUE

    Der p-Wert der Mann-Kendall-Statistik zur Messung der statistischen Signifikanz des Trends der Hot- und Cold-Spot-Z-Werte an einer Position.

    Zweidimensional: ein p-Wert für jede analysierte Position.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_ZSCORE

    Der Z-Wert zur Messung des dem Trend der Z-Werte für Hot-/Cold-Spots zugeordneten Mann-Kendall-Trends (zu- oder abnehmend). Ein positiver Z-Wert verweist auf einen zunehmenden Trend, ein negativer Z-Wert verweist auf einen abnehmenden Trend.

    Zweidimensional: ein Z-Wert für jede analysierte Position.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_BIN

    Ergebniskategorie zur Klassifizierung jeder Position; aus den Z-Werten für Hot-/Cold-Spots wird ein statistisch signifikanter Aufwärts- bzw. Abwärtstrend abgeleitet.

    • -3: Abwärtstrend, 99 % Sicherheit
    • -2: Abwärtstrend, 95 % Sicherheit
    • -1: Abwärtstrend, 90 % Sicherheit
    • 0: kein signifikanter Trend
    • 1: Aufwärtstrend, 90 % Sicherheit
    • 2: Aufwärtstrend, 95 % Sicherheit
    • 3: Aufwärtstrend, 99 % Sicherheit

    Zweidimensional: eine Klasseneinteilungskategorie für jede analysierte Position.

    EMERGING_{ANALYSIS_VARIABLE}_CATEGORY

    Eine der 17 Kategorien, 1 bis 8, 0 sowie -1 bis -8.

    • 1, neuer Hot-Spot
    • 2, konsekutiver Hot-Spot
    • 3, sich verstärkender Hot-Spot
    • 4, dauerhafter Hot-Spot
    • 5, sich abschwächender Hot-Spot
    • 6, zeitweiliger Hot-Spot
    • 7, schwankender Hot-Spot
    • 8, ehemaliger Hot-Spot
    • 0, kein Muster erkannt
    • -1, neuer Cold-Spot
    • -2, konsekutiver Cold-Spot
    • -3, sich verstärkender Cold-Spot
    • -4, dauerhafter Cold-Spot
    • -5, sich abschwächender Cold-Spot
    • -6, zeitweiliger Cold-Spot
    • -7, schwankender Cold-Spot
    • -8, ehemaliger Cold-Spot

    Zweidimensional: eine Kategorie für jede analysierte Position.

Syntax

arcpy.stpm.EmergingHotSpotAnalysis(in_cube, analysis_variable, output_features, {neighborhood_distance}, {neighborhood_time_step}, {polygon_mask}, {conceptualization_of_spatial_relationships}, {number_of_neighbors}, {define_global_window})
ParameterErklärungDatentyp
in_cube

Der zu analysierende netCDF-Würfel. Diese Datei muss eine Erweiterung (.nc) aufweisen und mit dem Werkzeug Raum-Zeit-Würfel durch Aggregieren von Punkten erstellen oder dem Werkzeug Raum-Zeit-Würfel aus definierten Features erstellen erstellt worden sein.

File
analysis_variable

Die numerische Variable in der netCDF-Datei, die analysiert werden soll.

String
output_features

Die Ergebnisse der Ausgabe-Feature-Class. Diese Feature-Class ist eine zweidimensionale Kartendarstellung der Hot- und Cold-Spot-Trends in Ihren Daten. Es werden beispielsweise alle neuen oder sich verstärkenden Hot-Spots dargestellt.

Feature Class
neighborhood_distance
(optional)

Die räumliche Ausdehnung der Analysenachbarschaft. Anhand dieses Wertes wird bestimmt, welche Features zusammen analysiert werden, um lokale Raum-Zeit-Cluster-Bildung zu bewerten.

Linear Unit
neighborhood_time_step
(optional)

Die Anzahl der Zeitschrittintervalle, die in die Analysenachbarschaft einbezogen werden sollen. Anhand dieses Wertes wird bestimmt, welche Features zusammen analysiert werden, um lokale Raum-Zeit-Cluster-Bildung zu bewerten.

Long
polygon_mask
(optional)

Ein Polygon-Feature-Layer mit mindestens einem Polygon, der das Analyse-Untersuchungsgebiet definiert. Eine Polygon-Analysemaske wird verwendet, um beispielsweise einen großen See aus der Analyse auszuschließen. Im in_cube definierte Abschnitte, die außerhalb der Maske liegen, werden nicht in die Analyse einbezogen.

Dieser Parameter ist nur für Grid-Würfel verfügbar.

Feature Layer
conceptualization_of_spatial_relationships
(optional)

Gibt an, wie räumliche Beziehungen zwischen Abschnitten definiert werden.

  • FIXED_DISTANCEJeder Abschnitt wird im Kontext benachbarter Abschnitte analysiert. Benachbarte Abschnitte innerhalb der angegebenen kritischen Entfernung (neighborhood_distance) erhalten eine Gewichtung von 1 und beeinflussen die Berechnungen für den Zielabschnitt. Benachbarte Features außerhalb der kritischen Entfernung erhalten eine Gewichtung von 0 und haben keinen Einfluss auf die Berechnungen eines Zielabschnitts.
  • K_NEAREST_NEIGHBORSDie nächstgelegenen k Abschnitte werden in die Analyse für den Zielabschnitt einbezogen; k ist dabei ein festgelegter numerischer Parameter.
  • CONTIGUITY_EDGES_ONLYNur benachbarte Abschnitte mit einer gemeinsamen Kante beeinflussen Berechnungen für den Ziel-Polygon-Abschnitt.
  • CONTIGUITY_EDGES_CORNERSAbschnitte mit einer gemeinsamen Kante oder einem gemeinsamen Knoten beeinflussen Berechnungen für den Ziel-Polygon-Abschnitt.
String
number_of_neighbors
(optional)

Eine Ganzzahl zur Angabe entweder der Mindestanzahl oder der exakten Anzahl der Nachbarn, die in Berechnungen für den Ziel-Abschnitt einbezogen werden soll. Bei K_NEAREST_NEIGHBORS hat jeder Abschnitt exakt diese angegebene Anzahl von Nachbarn. Bei FIXED_DISTANCE_BAND hat jeder Abschnitt mindestens diese Anzahl von Nachbarn (der Entfernungsschwellenwert wird zum Erreichen dieser Nachbaranzahl bei Bedarf vorübergehend erweitert). Wenn eine der Konzeptualisierungen für Nachbarschaften ausgewählt ist, wird jeder Abschnitt dieser Mindestanzahl von Nachbarn zugewiesen. Für Abschnitte mit einer geringeren Anzahl von zusammenhängenden Nachbarn basieren zusätzliche Nachbarn auf der Nachbarschaft von Feature-Schwerpunkten.

Long
define_global_window
(optional)

In der Statistik wird eine lokale, aus den Nachbarn für jeden Abschnitt berechnete Statistik mit einem globalen Wert verglichen. Mit diesem Parameter können Sie steuern, welche Abschnitte zum Berechnen des globalen Werts verwendet werden.

  • ENTIRE_CUBEJede Nachbarschaft wird im Vergleich zum gesamten Würfel analysiert. Dies ist die Standardeinstellung.
  • NEIGHBORHOOD_TIME_STEPJede Nachbarschaft wird im Vergleich zu den Abschnitten analysiert, die im festgelegten Nachbarschaftszeitintervall enthalten sind.
  • INDIVIDUAL_TIME_STEPJede Nachbarschaft wird im Vergleich zu den Abschnitten im selben Zeitintervall analysiert.
String

Codebeispiel

EmergingHotSpotAnalysis – Beispiel 1 (Python-Fenster)

Das folgende Skript veranschaulicht die Verwendung des Werkzeugs EmergingHotSpotAnalysis im Python-Fenster.

import arcpy
arcpy.env.workspace = r"C:\STPM"
arcpy.EmergingHotSpotAnalysis_stpm("Homicides.nc", "COUNT", "EHS_Homicides.shp", "5 Miles", 2, "#", "FIXED_DISTANCE", "3")
EmergingHotSpotAnalysis – Beispiel 2 (eigenständiges Skript)

Das folgende eigenständige Python-Skript veranschaulicht, wie Sie das Werkzeug EmergingHotSpotAnalysis verwenden.

# Create Space Time Cube of homicide incidents in a metropolitan area
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\STPM"
try:
    # Set the current workspace (to avoid having to specify the full path to the feature 
    # classes each time)
    arcpy.env.workspace = workspace
    # Create Space Time Cube of homicide incident data with 3 months and 3 miles settings
    # Process: Create Space Time Cube 
    cube = arcpy.CreateSpaceTimeCube_stpm("Homicides.shp", "Homicides.nc", "MyDate", "#", 
                                          "3 Months", "End time", "#", "3 Miles", "Property MEDIAN SPACETIME; Age STD ZEROS",
																																										"HEXAGON_GRID")
    # Create a polygon that defines where incidents are possible  
    # Process: Minimum Bounding Geometry of homicide incident data
    arcpy.MinimumBoundingGeometry_management("Homicides.shp", "bounding.shp", "CONVEX_HULL",
                                             "ALL", "#", "NO_MBG_FIELDS")
    # Emerging Hot Spot Analysis of homicide incident cube using 5 Miles neighborhood 
    # distance and 2 neighborhood time step to detect hot spots
    # Process: Emerging Hot Spot Analysis 
    cube = arcpy.EmergingHotSpotAnalysis_stpm("Homicides.nc", "COUNT", "EHS_Homicides.shp", 
                                              "5 Miles", 2, "bounding.shp", "FIXED_DISTANCE", "3")
except arcpy.ExecuteError:
    # If any error occurred when running the tool, print the messages
    print(arcpy.GetMessages())

Lizenzinformationen

  • Basic: Ja
  • Standard: Ja
  • Advanced: Ja

Verwandte Themen