Veränderungspunkte erkennen (Space Time Pattern Mining)

Zusammenfassung

Erkennt Zeitschritte, wenn sich eine statistische Eigenschaft der Zeitserie an einer Position eines Raum-Zeit-Würfels ändert.

Das Werkzeug kann Änderungen im Mittelwert, in der Standardabweichung oder im linearen Trend von kontinuierlichen (stetigen) Variablen sowie Änderungen im Mittelwert von Häufigkeitsvariablen erkennen. Dabei kann entweder die Anzahl der Veränderungspunkte an jeder Position durch das Werkzeug bestimmt werden oder eine definierte Anzahl der Veränderungspunkte, die für alle Positionen verwendet werden soll, angegeben werden. Die Veränderungspunkte teilen eine Zeitserie so in Segmente, dass die Werte in jedem Segment einen ähnlichen Mittelwert, eine ähnliche Standardabweichung oder einen linearen Trend aufweisen. Da Veränderungspunkte in jedem neuen Segment als erster Zeitschritt definiert werden, liegt die Anzahl der Veränderungspunkte immer um genau eins niedriger als die Anzahl der Segmente.

Weitere Informationen zur Funktionsweise von "Veränderungspunkte erkennen"

Abbildung

Abbildung des Werkzeugs "Veränderungspunkte erkennen"

Verwendung

  • Wenn der Parameter Methode auf Anzahl der Veränderungspunkte automatisch erkennen festgelegt ist, wird die Empfindlichkeit der Erkennung mit dem Parameter Erkennungsempfindlichkeit gesteuert. Je höher die Werte für die Empfindlichkeit sind, desto mehr Veränderungspunkte werden an einer Position erkannt. Da die Auswahl der Empfindlichkeit für die Ergebnisse der Analyse entscheidend ist, wird empfohlen, dass Sie mehrere Werte ausprobieren und die jeweiligen Ergebnisse vergleichen.

    Weitere Informationen zur Erkennungsempfindlichkeit

  • Für Analysevariablen, die Häufigkeitswerte darstellen, ist die Option Anzahl des Parameters Veränderungstyp für das Erkennen von Veränderungen im Mittelwert der Häufigkeitswerte oft am besten geeignet. Allerdings könnten mit der Option Mean Shift durchaus vergleichbare oder sogar bessere Ergebnisse für Häufigkeitsdaten erzielt werden. Dies liegt daran, dass das Modell des Veränderungstyps "Anzahl" davon ausgeht, dass die Werte jedes Segments einer Poisson-Verteilung gehorchen, in der die Varianz des Segments gleich dem Mittelwert des Segments ist. Beim Veränderungstyp "Mean Shift" wird dagegen davon ausgegangen, dass die Werte jedes Segments normalverteilt sind, sodass der Mittelwert durchaus kleiner oder größer als die Varianz der Werte sein kann.

    In einer Poisson-Verteilung liegen die meisten Häufigkeitswerte innerhalb von zwei Quadratwurzeln des Mittelwertes. Beispiel: Bei einer Poisson-Verteilung mit einem Mittelwert gleich 100 liegen etwa 95 Prozent der Häufigkeitswerte zwischen 80 und 120 (2 * sqrt(100) = 20). Bei einer Poisson-Verteilung mit einem Mittelwert gleich 1 Million liegen die meisten Häufigkeitswerte zwischen 998.000 und 1.002.000 (die Quadratwurzel von 1 Million ist 1.000). Der Bereich der Häufigkeitswerte ist für den größeren Mittelwert von 1 Million vergleichsweise schmal, wobei die meisten Häufigkeitswerte innerhalb eines Bereichs von 0,2 Prozent um den Mittelwert liegen. Bei dem kleineren Mittelwert von 100 weichen die Häufigkeitswerte jedoch um bis zu 20 Prozent vom Mittelwert ab. Wenn die Häufigkeitswerte verglichen mit ihrem Mittelwert stärker als erwartet von einer Poisson-Verteilung abweichen, können viele Zeitschritte als Veränderungspunkte erkannt werden. Am häufigsten ist dies bei großen Häufigkeitswerten der Fall. In diesem Fall wird empfohlen, dass Sie die Erkennung mit "Mean Shift" verwenden.

  • Dieses Werkzeug akzeptiert NetCDF-Dateien, die von verschiedenen Werkzeugen in der Toolbox "Space Time Pattern Mining" erstellt werden.

    Weitere Informationen zum Erstellen eines Raum-Zeit-Würfels

  • Der Wert des Parameters Ausgabe-Features wird im Bereich Inhalt hinzugefügt, wobei das Rendering neben den Feldern mit den Datumsangaben des ersten und letzten Veränderungspunktes auf der Anzahl der an jeder Position erkannten Veränderungspunkte basiert. Die Pop-ups der Features enthalten ein Liniendiagramm, in dem die Zeitserienwerte, Veränderungspunkte und Schätzungen des Mittelwertes oder der Standardabweichung der Segmente zwischen den einzelnen Veränderungspunkten angezeigt werden.

  • Die Layer-Zeit des Wertes im Parameter Ausgabe-Features basiert auf dem Datum des ersten Veränderungspunktes. Mit dem Zeitschieberegler können Sie die Positionen basierend auf dem Datum des ersten Veränderungspunktes filtern. Als Layer-Zeit kann in den Layer-Eigenschaften auch das Datum des letzten Veränderungspunktes festgelegt werden.

  • Der Eingabe-Raum-Zeit-Würfel wird mit den Ergebnissen der Analyse aktualisiert und kann im Werkzeug Raum-Zeit-Würfel in 3D visualisieren mit der Option Zeitserien-Veränderungspunkte des Parameters Anzeigedesign verwendet werden, um die Ergebnisse in 3D anzuzeigen. Die Ausgabe enthält dann ein Feature pro Zeitschritt des Raum-Zeit-Würfels mit Feldern, die angeben, ob der Zeitschritt ein Veränderungspunkt ist, sowie die Schätzungen des Mittelwertes oder der Standardabweichung des Segments. Unter Verwendung des Raum-Zeit-Würfels im Werkzeug Raum-Zeit-Würfel in 2D visualisieren wird dann die Ausgabe-Feature-Class der Erkennung von Veränderungspunkten erneut erstellt.

  • Dieses Werkzeug unterstützt die Parallelverarbeitung, um separate Positionen auf verschiedenen Prozessorkernen zu analysieren, und nutzt standardmäßig 50 Prozent der verfügbaren Prozessoren. Die Anzahl der Prozessoren kann mit der Umgebung Faktor für parallele Verarbeitung erhöht oder verringert werden.

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Raum-Zeit-Würfel

Der Raum-Zeit-Würfel, der die zu analysierende Variable enthält. Raum-Zeit-Würfel weisen die Dateierweiterung .nc auf und werden von verschiedenen Werkzeugen in der Toolbox "Space Time Pattern Mining" erstellt.

File
Analysevariable

Die numerische Variable des Raum-Zeit-Würfels, der die Zeitserienwerte jeder Position enthält.

String
Ausgabe-Features

Die Ausgabe-Feature-Class, die die Ergebnisse der Erkennung von Veränderungspunkten enthält. Der Layer zeigt die Anzahl der an jeder Position erkannten Veränderungspunkte an und enthält Pop-up-Liniendiagramme, die die Zeitserienwerte, Veränderungspunkte und Schätzungen des Mittelwertes oder der Standardabweichung jedes Segments anzeigen.

Feature Class
Art der Änderung
(optional)

Gibt den Typ der Änderung an, die erkannt wird. Jede Option gibt eine statistische Eigenschaft der Zeitserie an, die in jedem Segment als konstant angenommen wird. Der Wert ändert sich an jedem Veränderungspunkt in der Zeitserie auf einen neuen konstanten Wert.

  • Mean ShiftVerschiebungen des Mittelwertes werden erkannt. Dies ist die Standardeinstellung.
  • StandardabweichungÄnderungen in der Standardabweichung werden erkannt.
  • Neigung (linearer Trend)Änderungen der Neigung (linearer Trend) werden erkannt.
  • AnzahlÄnderungen im Mittelwert der Häufigkeitsdaten werden erkannt.
String
Methode
(optional)

Gibt an, ob die Anzahl der Veränderungspunkte automatisch erkannt werden soll oder durch eine definierte Anzahl der Veränderungspunkte für alle Positionen angegeben wird.

  • Anzahl der Veränderungspunkte automatisch erkennen (PELT)Die Anzahl der Veränderungspunkte wird automatisch erkannt. Die Empfindlichkeit der Erkennung wird durch den Parameter Erkennungsempfindlichkeit definiert. Dies ist die Standardeinstellung.
  • Definierte Anzahl der Veränderungspunkte (SegNeigh)Die Anzahl der Veränderungspunkte wird durch den Parameter Anzahl der Veränderungspunkte definiert.
String
Anzahl der Veränderungspunkte
(optional)

Die Anzahl der Veränderungspunkte, die an einer Position erkannt werden sollen. Die Standardeinstellung ist 1.

Long
Erkennungsempfindlichkeit
(optional)

Eine Zahl zwischen 0 und 1, die die Empfindlichkeit der Erkennung definiert. Je höher die Werte sind, desto mehr Veränderungspunkte werden an einer Position erkannt. Die Standardeinstellung ist 0,5.

Double
Minimale Segmentlänge
(optional)

Die minimale Anzahl an Zeitschritten in jedem Segment. Die Veränderungspunkte teilen alle Zeitserien in Segmente, in denen jedes Segment mindestens diese Anzahl an Zeitschritten aufweist. Für eine Veränderung von Mittelwert, Standardabweichung und Anzahl ist die Standardeinstellung 1. Dies bedeutet, dass jeder Zeitschritt ein Veränderungspunkt sein kann. Für eine Veränderung der Neigung (linearer Trend) ist die Standardeinstellung 2, da für eine entsprechende Linie mindestens zwei Werte erforderlich sind. Der Wert muss kleiner als die Hälfte der Anzahl an Zeitschritten in der Zeitserie sein.

Long

arcpy.stpm.ChangePointDetection(in_cube, analysis_variable, output_features, {change_type}, {method}, {num_change_points}, {sensitivity}, {min_seg_len})
NameErläuterungDatentyp
in_cube

Der Raum-Zeit-Würfel, der die zu analysierende Variable enthält. Raum-Zeit-Würfel weisen die Dateierweiterung .nc auf und werden von verschiedenen Werkzeugen in der Toolbox "Space Time Pattern Mining" erstellt.

File
analysis_variable

Die numerische Variable des Raum-Zeit-Würfels, der die Zeitserienwerte jeder Position enthält.

String
output_features

Die Ausgabe-Feature-Class, die die Ergebnisse der Erkennung von Veränderungspunkten enthält. Der Layer zeigt die Anzahl der an jeder Position erkannten Veränderungspunkte an und enthält Pop-up-Liniendiagramme, die die Zeitserienwerte, Veränderungspunkte und Schätzungen des Mittelwertes oder der Standardabweichung jedes Segments anzeigen.

Feature Class
change_type
(optional)

Gibt den Typ der Änderung an, die erkannt wird. Jede Option gibt eine statistische Eigenschaft der Zeitserie an, die in jedem Segment als konstant angenommen wird. Der Wert ändert sich an jedem Veränderungspunkt in der Zeitserie auf einen neuen konstanten Wert.

  • MEANVerschiebungen des Mittelwertes werden erkannt. Dies ist die Standardeinstellung.
  • STANDARD_DEVIATIONÄnderungen in der Standardabweichung werden erkannt.
  • SLOPEÄnderungen der Neigung (linearer Trend) werden erkannt.
  • COUNTÄnderungen im Mittelwert der Häufigkeitsdaten werden erkannt.
String
method
(optional)

Gibt an, ob die Anzahl der Veränderungspunkte automatisch erkannt werden soll oder durch eine definierte Anzahl der Veränderungspunkte für alle Positionen angegeben wird.

  • AUTO_DETECTDie Anzahl der Veränderungspunkte wird automatisch erkannt. Die Empfindlichkeit der Erkennung wird durch den Parameter sensitivity definiert. Dies ist die Standardeinstellung.
  • DEFINED_NUMBERDie Anzahl der Veränderungspunkte wird durch den Parameter num_change_points definiert.
String
num_change_points
(optional)

Die Anzahl der Veränderungspunkte, die an einer Position erkannt werden sollen. Die Standardeinstellung ist 1.

Long
sensitivity
(optional)

Eine Zahl zwischen 0 und 1, die die Empfindlichkeit der Erkennung definiert. Je höher die Werte sind, desto mehr Veränderungspunkte werden an einer Position erkannt. Die Standardeinstellung ist 0,5.

Double
min_seg_len
(optional)

Die minimale Anzahl an Zeitschritten in jedem Segment. Die Veränderungspunkte teilen alle Zeitserien in Segmente, in denen jedes Segment mindestens diese Anzahl an Zeitschritten aufweist. Für eine Veränderung von Mittelwert, Standardabweichung und Anzahl ist die Standardeinstellung 1. Dies bedeutet, dass jeder Zeitschritt ein Veränderungspunkt sein kann. Für eine Veränderung der Neigung (linearer Trend) ist die Standardeinstellung 2, da für eine entsprechende Linie mindestens zwei Werte erforderlich sind. Der Wert muss kleiner als die Hälfte der Anzahl an Zeitschritten in der Zeitserie sein.

Long

Codebeispiel

ChangePointDetection – Beispiel 1 (Python-Fenster)

Das folgende Python-Skript veranschaulicht, wie die Funktion ChangePointDetection verwendet wird.

import arcpy
arcpy.env.workspace = "C:/Analysis"

# Automatically detect changes in population counts
arcpy.stpm.ChangePointDetection("Population.nc", "Pop_NONE_ZEROS", 
                            "Analysis.gdb/Population_Change_Points", 
                            "COUNT", "AUTO_DETECT", "", 0.5, 1)
ChangePointDetection – Beispiel 2 (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht, wie die Funktion ChangePointDetection verwendet wird.

# Detect changes in air temperature.

# Import system modules.
import arcpy

# Set property to overwrite existing output.
arcpy.env.overwriteOutput = True

# Set workspace.
workspace = r"C:\Analysis"
arcpy.env.workspace = workspace

# Detect the largest mean shift of temperature measurements.
arcpy.stpm.ChangePointDetection("Air_Temp.nc", "MAX_DEGREES_F", 
                            "Analysis.gdb/Temperature_Change_Points", 
                            "MEAN", "DEFINED_NUMBER", 1, "", 3)

# Create a feature class visualizing the change point results in a 3D scene view.
arcpy.stpm.VisualizeSpaceTimeCube3D("Air_Temp.nc", "Pop_NONE_ZEROS", 
                                    "VALUE", "Analysis.gdb/ForecastsFC")

Lizenzinformationen

  • Basic: Ja
  • Standard: Ja
  • Advanced: Ja

Verwandte Themen