Beschriftung | Erläuterung | Datentyp |
Eingabe-Raum-Zeit-Würfel | Der Raum-Zeit-Würfel, der die zu analysierende Variable enthält. Raum-Zeit-Würfel weisen die Dateierweiterung .nc auf und werden von verschiedenen Werkzeugen in der Toolbox "Space Time Pattern Mining" erstellt. | File |
Analysevariable | Die numerische Variable des Raum-Zeit-Würfels, der die Zeitserienwerte jeder Position enthält. | String |
Ausgabe-Features | Die Ausgabe-Feature-Class, die die Ergebnisse der Erkennung von Veränderungspunkten enthält. Der Layer zeigt die Anzahl der an jeder Position erkannten Veränderungspunkte an und enthält Pop-up-Liniendiagramme, die die Zeitserienwerte, Veränderungspunkte und Schätzungen des Mittelwertes oder der Standardabweichung jedes Segments anzeigen. | Feature Class |
Art der Änderung (optional) | Gibt den Typ der Änderung an, die erkannt wird. Jede Option gibt eine statistische Eigenschaft der Zeitserie an, die in jedem Segment als konstant angenommen wird. Der Wert ändert sich an jedem Veränderungspunkt in der Zeitserie auf einen neuen konstanten Wert.
| String |
Methode (optional) | Gibt an, ob die Anzahl der Veränderungspunkte automatisch erkannt werden soll oder durch eine definierte Anzahl der Veränderungspunkte für alle Positionen angegeben wird.
| String |
Anzahl der Veränderungspunkte (optional) | Die Anzahl der Veränderungspunkte, die an einer Position erkannt werden sollen. Die Standardeinstellung ist 1. | Long |
Erkennungsempfindlichkeit (optional) | Eine Zahl zwischen 0 und 1, die die Empfindlichkeit der Erkennung definiert. Je höher die Werte sind, desto mehr Veränderungspunkte werden an einer Position erkannt. Die Standardeinstellung ist 0,5. | Double |
Minimale Segmentlänge (optional) | Die minimale Anzahl an Zeitschritten in jedem Segment. Die Veränderungspunkte teilen alle Zeitserien in Segmente, in denen jedes Segment mindestens diese Anzahl an Zeitschritten aufweist. Für eine Veränderung von Mittelwert, Standardabweichung und Anzahl ist die Standardeinstellung 1. Dies bedeutet, dass jeder Zeitschritt ein Veränderungspunkt sein kann. Für eine Veränderung der Neigung (linearer Trend) ist die Standardeinstellung 2, da für eine entsprechende Linie mindestens zwei Werte erforderlich sind. Der Wert muss kleiner als die Hälfte der Anzahl an Zeitschritten in der Zeitserie sein. | Long |
Zusammenfassung
Erkennt Zeitschritte, wenn sich eine statistische Eigenschaft der Zeitserie an einer Position eines Raum-Zeit-Würfels ändert.
Das Werkzeug kann Änderungen im Mittelwert, in der Standardabweichung oder im linearen Trend von kontinuierlichen (stetigen) Variablen sowie Änderungen im Mittelwert von Häufigkeitsvariablen erkennen. Dabei kann entweder die Anzahl der Veränderungspunkte an jeder Position durch das Werkzeug bestimmt werden oder eine definierte Anzahl der Veränderungspunkte, die für alle Positionen verwendet werden soll, angegeben werden. Die Veränderungspunkte teilen eine Zeitserie so in Segmente, dass die Werte in jedem Segment einen ähnlichen Mittelwert, eine ähnliche Standardabweichung oder einen linearen Trend aufweisen. Da Veränderungspunkte in jedem neuen Segment als erster Zeitschritt definiert werden, liegt die Anzahl der Veränderungspunkte immer um genau eins niedriger als die Anzahl der Segmente.
Weitere Informationen zur Funktionsweise von "Veränderungspunkte erkennen"
Abbildung
Verwendung
Wenn der Parameter Methode auf Anzahl der Veränderungspunkte automatisch erkennen festgelegt ist, wird die Empfindlichkeit der Erkennung mit dem Parameter Erkennungsempfindlichkeit gesteuert. Je höher die Werte für die Empfindlichkeit sind, desto mehr Veränderungspunkte werden an einer Position erkannt. Da die Auswahl der Empfindlichkeit für die Ergebnisse der Analyse entscheidend ist, wird empfohlen, dass Sie mehrere Werte ausprobieren und die jeweiligen Ergebnisse vergleichen.
Für Analysevariablen, die Häufigkeitswerte darstellen, ist die Option Anzahl des Parameters Veränderungstyp für das Erkennen von Veränderungen im Mittelwert der Häufigkeitswerte oft am besten geeignet. Allerdings könnten mit der Option Mean Shift durchaus vergleichbare oder sogar bessere Ergebnisse für Häufigkeitsdaten erzielt werden. Dies liegt daran, dass das Modell des Veränderungstyps "Anzahl" davon ausgeht, dass die Werte jedes Segments einer Poisson-Verteilung gehorchen, in der die Varianz des Segments gleich dem Mittelwert des Segments ist. Beim Veränderungstyp "Mean Shift" wird dagegen davon ausgegangen, dass die Werte jedes Segments normalverteilt sind, sodass der Mittelwert durchaus kleiner oder größer als die Varianz der Werte sein kann.
In einer Poisson-Verteilung liegen die meisten Häufigkeitswerte innerhalb von zwei Quadratwurzeln des Mittelwertes. Beispiel: Bei einer Poisson-Verteilung mit einem Mittelwert gleich 100 liegen etwa 95 Prozent der Häufigkeitswerte zwischen 80 und 120 (2 * sqrt(100) = 20). Bei einer Poisson-Verteilung mit einem Mittelwert gleich 1 Million liegen die meisten Häufigkeitswerte zwischen 998.000 und 1.002.000 (die Quadratwurzel von 1 Million ist 1.000). Der Bereich der Häufigkeitswerte ist für den größeren Mittelwert von 1 Million vergleichsweise schmal, wobei die meisten Häufigkeitswerte innerhalb eines Bereichs von 0,2 Prozent um den Mittelwert liegen. Bei dem kleineren Mittelwert von 100 weichen die Häufigkeitswerte jedoch um bis zu 20 Prozent vom Mittelwert ab. Wenn die Häufigkeitswerte verglichen mit ihrem Mittelwert stärker als erwartet von einer Poisson-Verteilung abweichen, können viele Zeitschritte als Veränderungspunkte erkannt werden. Am häufigsten ist dies bei großen Häufigkeitswerten der Fall. In diesem Fall wird empfohlen, dass Sie die Erkennung mit "Mean Shift" verwenden.
Dieses Werkzeug akzeptiert NetCDF-Dateien, die von verschiedenen Werkzeugen in der Toolbox "Space Time Pattern Mining" erstellt werden.
Der Wert des Parameters Ausgabe-Features wird im Bereich Inhalt hinzugefügt, wobei das Rendering neben den Feldern mit den Datumsangaben des ersten und letzten Veränderungspunktes auf der Anzahl der an jeder Position erkannten Veränderungspunkte basiert. Die Pop-ups der Features enthalten ein Liniendiagramm, in dem die Zeitserienwerte, Veränderungspunkte und Schätzungen des Mittelwertes oder der Standardabweichung der Segmente zwischen den einzelnen Veränderungspunkten angezeigt werden.
Die Layer-Zeit des Wertes im Parameter Ausgabe-Features basiert auf dem Datum des ersten Veränderungspunktes. Mit dem Zeitschieberegler können Sie die Positionen basierend auf dem Datum des ersten Veränderungspunktes filtern. Als Layer-Zeit kann in den Layer-Eigenschaften auch das Datum des letzten Veränderungspunktes festgelegt werden.
Der Eingabe-Raum-Zeit-Würfel wird mit den Ergebnissen der Analyse aktualisiert und kann im Werkzeug Raum-Zeit-Würfel in 3D visualisieren mit der Option Zeitserien-Veränderungspunkte des Parameters Anzeigedesign verwendet werden, um die Ergebnisse in 3D anzuzeigen. Die Ausgabe enthält dann ein Feature pro Zeitschritt des Raum-Zeit-Würfels mit Feldern, die angeben, ob der Zeitschritt ein Veränderungspunkt ist, sowie die Schätzungen des Mittelwertes oder der Standardabweichung des Segments. Unter Verwendung des Raum-Zeit-Würfels im Werkzeug Raum-Zeit-Würfel in 2D visualisieren wird dann die Ausgabe-Feature-Class der Erkennung von Veränderungspunkten erneut erstellt.
Dieses Werkzeug unterstützt die Parallelverarbeitung, um separate Positionen auf verschiedenen Prozessorkernen zu analysieren, und nutzt standardmäßig 50 Prozent der verfügbaren Prozessoren. Die Anzahl der Prozessoren kann mit der Umgebung Faktor für parallele Verarbeitung erhöht oder verringert werden.
Parameter
arcpy.stpm.ChangePointDetection(in_cube, analysis_variable, output_features, {change_type}, {method}, {num_change_points}, {sensitivity}, {min_seg_len})
Name | Erläuterung | Datentyp |
in_cube | Der Raum-Zeit-Würfel, der die zu analysierende Variable enthält. Raum-Zeit-Würfel weisen die Dateierweiterung .nc auf und werden von verschiedenen Werkzeugen in der Toolbox "Space Time Pattern Mining" erstellt. | File |
analysis_variable | Die numerische Variable des Raum-Zeit-Würfels, der die Zeitserienwerte jeder Position enthält. | String |
output_features | Die Ausgabe-Feature-Class, die die Ergebnisse der Erkennung von Veränderungspunkten enthält. Der Layer zeigt die Anzahl der an jeder Position erkannten Veränderungspunkte an und enthält Pop-up-Liniendiagramme, die die Zeitserienwerte, Veränderungspunkte und Schätzungen des Mittelwertes oder der Standardabweichung jedes Segments anzeigen. | Feature Class |
change_type (optional) | Gibt den Typ der Änderung an, die erkannt wird. Jede Option gibt eine statistische Eigenschaft der Zeitserie an, die in jedem Segment als konstant angenommen wird. Der Wert ändert sich an jedem Veränderungspunkt in der Zeitserie auf einen neuen konstanten Wert.
| String |
method (optional) | Gibt an, ob die Anzahl der Veränderungspunkte automatisch erkannt werden soll oder durch eine definierte Anzahl der Veränderungspunkte für alle Positionen angegeben wird.
| String |
num_change_points (optional) | Die Anzahl der Veränderungspunkte, die an einer Position erkannt werden sollen. Die Standardeinstellung ist 1. | Long |
sensitivity (optional) | Eine Zahl zwischen 0 und 1, die die Empfindlichkeit der Erkennung definiert. Je höher die Werte sind, desto mehr Veränderungspunkte werden an einer Position erkannt. Die Standardeinstellung ist 0,5. | Double |
min_seg_len (optional) | Die minimale Anzahl an Zeitschritten in jedem Segment. Die Veränderungspunkte teilen alle Zeitserien in Segmente, in denen jedes Segment mindestens diese Anzahl an Zeitschritten aufweist. Für eine Veränderung von Mittelwert, Standardabweichung und Anzahl ist die Standardeinstellung 1. Dies bedeutet, dass jeder Zeitschritt ein Veränderungspunkt sein kann. Für eine Veränderung der Neigung (linearer Trend) ist die Standardeinstellung 2, da für eine entsprechende Linie mindestens zwei Werte erforderlich sind. Der Wert muss kleiner als die Hälfte der Anzahl an Zeitschritten in der Zeitserie sein. | Long |
Codebeispiel
Das folgende Python-Skript veranschaulicht, wie die Funktion ChangePointDetection verwendet wird.
import arcpy
arcpy.env.workspace = "C:/Analysis"
# Automatically detect changes in population counts
arcpy.stpm.ChangePointDetection("Population.nc", "Pop_NONE_ZEROS",
"Analysis.gdb/Population_Change_Points",
"COUNT", "AUTO_DETECT", "", 0.5, 1)
Das folgende Python-Skript veranschaulicht, wie die Funktion ChangePointDetection verwendet wird.
# Detect changes in air temperature.
# Import system modules.
import arcpy
# Set property to overwrite existing output.
arcpy.env.overwriteOutput = True
# Set workspace.
workspace = r"C:\Analysis"
arcpy.env.workspace = workspace
# Detect the largest mean shift of temperature measurements.
arcpy.stpm.ChangePointDetection("Air_Temp.nc", "MAX_DEGREES_F",
"Analysis.gdb/Temperature_Change_Points",
"MEAN", "DEFINED_NUMBER", 1, "", 3)
# Create a feature class visualizing the change point results in a 3D scene view.
arcpy.stpm.VisualizeSpaceTimeCube3D("Air_Temp.nc", "Pop_NONE_ZEROS",
"VALUE", "Analysis.gdb/ForecastsFC")
Lizenzinformationen
- Basic: Ja
- Standard: Ja
- Advanced: Ja