Skip To Content

Zeitserien-Cluster-Bildung

Zusammenfassung

Partitioniert eine Sammlung von Zeitserien, die in einem Raum-Zeit-Würfel gespeichert ist, anhand der Ähnlichkeit von Zeitserieneigenschaften. Zeitserien können so gruppiert werden, dass sie im Zeitverlauf ähnliche Werte oder ähnliche Verhaltensweisen oder Profile (Zu- oder Abnahme an den gleichen Zeitpunkten) haben. Die Ausgabe dieses Werkzeugs ist eine 2D-Karte, in der jede Position im Würfel symbolisiert durch Cluster-Mitgliedschaft und Meldungen angezeigt wird. Darüber hinaus enthält die Ausgabe Diagramme mit Informationen zur repräsentativen Zeitseriensignatur für jeden Cluster.

Weitere Informationen zur Funktionsweise des Werkzeugs Zeitserien-Cluster-Bildung

Verwendung

  • Dieses Werkzeug akzeptiert netCDF-Dateien, die mit dem Werkzeug Raum-Zeit-Würfel durch Aggregieren von Punkten erstellen oder mit dem Werkzeug Raum-Zeit-Würfel aus definierten Features erstellen generiert wurden.

  • Mit diesem Werkzeug werden die Zeitserien an den einzelnen Positionen mit allen anderen Positionen im Eingabe-Raum-Zeit-Würfel verglichen. Die Interesseneigenschaft jedes Standortpaars wird verglichen und als Unähnlichkeitsmatrix zusammengefasst. Diese Ähnlichkeitsmessungen werden mit dem k-Medoids-Algorithmus gruppiert.

  • Die Ausgabe-Features werden dem Bereich Inhalt hinzugefügt, wobei das Rendering auf dem Feld CLUSTER_ID basiert und angegeben wird, in welchen Cluster die einzelnen Positionen fallen. Wenn Sie beispielsweise drei zu erstellende Cluster angeben, enthält jeder Datensatz im Feld CLUSTER_ID eine 1, 2 oder 3. Das Feld CENTER_REP, das den Wert 1 für die Position, die am repräsentativsten für die Zeitserie eines Clusters ist, enthält, wird ebenfalls hinzugefügt.

  • Mit diesem Werkzeug werden Meldungen und optionale Diagramme erstellt, mit denen Sie die Merkmale der identifizierten Cluster leichter verstehen können. Sie können auf diese Meldungen zugreifen, indem Sie mit der Maus auf die Fortschrittsleiste zeigen, auf die Pop-out-Schaltfläche klicken oder den Abschnitt "Meldungen" im Bereich Geoverarbeitung erweitern. Sie können auch über den Geoverarbeitungsverlauf auf die Meldungen für eine vorherige Ausführung des Werkzeugs Zeitserien-Cluster-Bildung zugreifen. Die Diagramme, die erstellt werden, wenn Sie die Ausgabetabelle für Diagramme generieren, können durch Klicken auf die Registerkarte Nach Diagrammen auflisten Nach Diagrammen auflisten im Bereich Inhalt aufgerufen werden.

  • Wenn Sie eine optionale Ausgabetabelle für Diagramme angeben, werden Diagramme erstellt, die die durchschnittliche Zeitserie pro Cluster und die Zeitserie-Cluster-Medoids anzeigen.

  • Weitere Informationen zu den ausgegebenen Meldungen und Diagrammen finden Sie unter Verwendung der Zeitserien-Cluster-Bildung.

  • Manchmal ist Ihnen die Clusteranzahl, die sich für Ihre Daten am besten eignet, bekannt. Wenn dem nicht so ist, müssen Sie möglicherweise verschiedene Werte für die Clusteranzahl ausprobieren, um herauszufinden, welche Werte die beste Clusterdifferenzierung ermöglichen. Wenn Sie den Parameter Anzahl der Cluster leer lassen, wertet das Werkzeug die optimale Anzahl der Cluster anhand der spektralen Abstandsheuristik aus und gibt die optimale Cluster-Anzahl im Nachrichtenfenster an.

  • Die Ähnlichkeit kann auf dem Wert der Zeitserie im Zeitverlauf oder auf dem Profil der einzelnen Zeitserien beruhen. Beim Attribut Profil wird die Kosinus-Ähnlichkeit zwischen jedem Positionspaar berechnet und erfasst, ob die Zeitserien gleichzeitig größer oder kleiner werden, anstatt sie anhand von Größen zu vergleichen. Beispielsweise würden eine Zeitserie mit den Werten 10, 20, 10 und 40 und eine Zeitserie mit den Werten 100, 200, 100 und 400 als ähnlich angesehen, wenn Sie Profil verwenden. Diese beiden Zeitserien würden jedoch als sehr unterschiedlich gelten, wenn Sie Wert verwenden.

  • Die Cluster-Zahl, die einer Position zugewiesen ist, kann sich bei einzelnen Ausführungen unterscheiden, da die Anfangswerte für den Beginn der Cluster-Erstellung vom Algorithmus nach dem Zufallsprinzip ausgewählt werden. Angenommen, Sie unterteilen Positionen basierend auf dem jährlichen Bevölkerungswachstum in zwei Cluster. Wenn Sie die Analyse das erste Mal ausführen, kann es sein, dass die Features für hohes Wachstum mit Cluster 2 und die Features für niedriges Wachstum mit Cluster 1 bezeichnet werden. Wenn Sie dieselbe Analyse ein weiteres Mal ausführen, werden die Features für hohes Wachstum möglicherweise mit Cluster 1 bezeichnet. Eventuell stellen Sie fest, dass einige Positionen mit durchschnittlichem oder mittlerem Wachstum einem anderen Cluster angehören als zuvor. Der Grund hierfür ist eine zufällige Komponente im k-Medoids-Algorithmus.

Syntax

TimeSeriesClustering_stpm (in_cube, analysis_variable, output_features, characteristic_of_interest, cluster_count, output_table_for_charts)
ParameterErläuterungDatentyp
in_cube

Der zu analysierende netCDF-Würfel. Diese Datei muss eine Erweiterung (.nc) aufweisen und mit dem Werkzeug Raum-Zeit-Würfel durch Aggregieren von Punkten erstellen oder Raum-Zeit-Würfel aus definierten Features erstellen erstellt worden sein.

File
analysis_variable

Die numerische Variable in der netCDF-Datei mit zeitbedingten Änderungen, über die ein Cluster von einem anderen unterschieden wird.

String
output_features

Die neue Ausgabe-Feature-Class mit allen Positionen im Raum-Zeit-Würfel und einem Feld, das die Cluster-Mitgliedschaft angibt. Die Feature-Class ist eine zweidimensionale Darstellung der Cluster in den Daten.

Feature Class
characteristic_of_interest

Der Aspekt der Zeitserie, mit dem die Bedeutung von Ähnlichkeit definiert wird. Wählen Sie aus, ob die Cluster-Bildung von Zeitserien auf Werten oder Zeitserienprofilen beruhen soll.

  • VALUE Positionen mit Zeitserien mit ähnlichen Werten wie die Analysevariable an denselben Zeitpunkten werden zusammen gruppiert.
  • PROFILEZeitserien mit ähnlichem Verhalten sowie ähnlicher Fluktuation und Komplexität werden zusammen gruppiert. Die Cluster-Bildung basiert auf der allgemeinen Form der Zeitserie einer Position.
String
cluster_count

Die Anzahl der zu erstellenden Cluster. Wenn kein Wert angegeben ist, wertet das Werkzeug die optimale Anzahl von Clustern mit der spektralen Abstandsheuristik aus. Die optimale Anzahl der Cluster wird im Meldungsfenster angezeigt.

Long
output_table_for_charts

Falls angegeben, enthält diese Tabelle die repräsentative Zeitserie für jeden Cluster, basierend auf dem Durchschnitt für jeden Zeitserien-Cluster und der Medoid-Zeitserie. Die über diese Tabelle erstellten Diagramme können durch Klicken auf die Registerkarte Nach Diagrammen auflisten im Bereich Inhalt aufgerufen werden.

Table

Codebeispiel

TimeSeriesClustering – Beispiel 1 (Python-Fenster)

Das folgende Python-Skript veranschaulicht die Verwendung des Werkzeugs TimeSeriesClustering.

import arcpy
arcpy.env.workspace = r"C:\Analysis"
arcpy.stpm.TimeSeriesClustering("COUNTY_CRIME.NC", "COUNT", 
    "COUNTY_CRIME_PATTERNS", "PROFILE", 5 , "CRIME_CHARTS")
TimeSeriesClustering – Beispiel 2 (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht, wie Sie das Werkzeug TimeSeriesClustering zum Gruppieren ähnlicher Ladenstandorte verwenden.

# Creating clusters of store locations with similar sales volumes over time
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\Analysis"
arcpy.env.workspace = workspace
# Create clusters of store location with similar sales volumes.  Automatically 
# determine optimal number of clusters.
arcpy.stats.TimeSeriesClustering("OH_STORES.NC", "SALES_SUM_ZERO", "SALES_TRENDS", 
    "VALUE", None , "SALES_CHARTS")
# Create a feature class containing all the bins in the input space time cube.
arcpy.stpm.VisualizeSpaceTimeCube3D("OH_STORES", "SALES_SUM_ZERO", "VALUE", 
    "SALES_BINS")
# Join the clustering results to the bins so each bin now has a cluster ID.
arcpy.management.AddJoin("SALES_BINS", "LOCATION", "SALES_TRENDS", "LOCATION", 
    "KEEP_ALL")
# Summarize the bins using Summary Statistics with Cluster ID as a case field 
# to get the minimum, maximum and average sales for each cluster.
arcpy.analysis.Statistics("SALES_DATA", "SALES_DATA_STATISTICS", 
    "SALES_DATA.VALUE MIN;SALES_DATA.VALUE MEAN;SALES_DATA.VALUE MAX", 
    "SALES_BINS.CLUSTER_ID")

Umgebungen

Zufallszahlengenerator

Der verwendete Zufallsgeneratortyp ist stets Mersenne Twister.

Lizenzinformationen

  • ArcGIS Desktop Basic: Ja
  • ArcGIS Desktop Standard: Ja
  • ArcGIS Desktop Advanced: Ja