Funktionsweise von "Raum-Zeit-Würfel erstellen"

Mithilfe eines Raum-Zeit-Würfels können Sie Ihre raumzeitlichen Daten durch die Analyse einer Zeitserie, die integrierte Analyse räumlicher und zeitlicher Muster und leistungsstarke 2D- und 3D-Visualisierungsmethoden visualisieren und analysieren. Für die Erstellung eines Raum-Zeit-Würfels zu Analysezwecken gibt es drei Werkzeuge: Raum-Zeit-Würfel durch Aggregieren von Punkten erstellen, Raum-Zeit-Würfel aus definierten Positionen erstellen und Raum-Zeit-Würfel aus multidimensionalem Raster-Layer erstellen. Die ersten beiden Werkzeuge strukturieren Features mit Zeitstempel in einem netCDF-Datenwürfel, indem Raum-Zeit-Abschnitte mit aggregierten Ereignispunkten oder definierte Features mit verknüpften raumzeitlichen Attributen generiert werden. Das dritte Werkzeug konvertiert einen multidimensionalen Raster-Layer mit aktivierten Zeiteigenschaften in einen Raum-Zeit-Würfel und führt keine räumliche oder zeitliche Aggregation durch.

Um Punkt-Features mit Zeitstempel räumlich zu aggregieren und die spatiotemporalen Muster an Positionen in Ihrem Untersuchungsgebiet zu verstehen, verwenden Sie das Werkzeug Raum-Zeit-Würfel durch Aggregieren von Punkten erstellen. Dies führt entweder zu einem Grid-Würfel (Netz oder Hexagon) oder zu einem Würfel, der anhand der definierten Positionen, die Sie als Aggregationspolygone angeben, strukturiert ist. Alle in einem Abschnitt des Würfels enthaltenen Punkte werden gezählt, die Zusammenfassungsfeld-Statistiken werden berechnet, und mithilfe der Mann-Kendall-Statistik wird der Trend für die Abschnitte im Zeitverlauf für jede Position ermittelt. Beim Aggregieren mit einem Netz- oder Hexagongitter wird ein Grid-Würfel erstellt. Wenn Sie die Aggregation mit einer Reihe von definierten Positionen als Aggregationspolygone durchführen, wird ein Würfel aus definierten Positionen erstellt. Das Erstellen eines Raum-Zeit-Würfels durch die Aggregation von Punkten ist besonders üblich, wenn die Punktdaten Ereignisse wie Verbrechen oder Kundenumsätze repräsentieren und Sie diese Ereignisse entweder in ein Gitternetz oder eine Reihe von Polygonen, die Polizeireviere bzw. Vertriebsregionen darstellen, aggregieren möchten.

Für Feature-Positionen, die sich im Zeitverlauf nicht ändern, sowie für Attribute oder Messungen, die im Laufe der Zeit gesammelt wurden (z. B. Panel- oder Stationsdaten), verwenden Sie das Werkzeug Raum-Zeit-Würfel aus definierten Positionen erstellen. Dies führt zu einem Würfel, der durch diese definierten Positionen strukturiert ist, entweder mit einer Reihe von Attributen pro Zeitraum (wenn keine zeitliche Aggregation gewählt wurde) oder mit Summenstatistiken zu jedem Zeitraum für die gewählten Attribute (wenn die zeitliche Aggregation gewählt wurde). Alle Beobachtungen, die in einem Abschnitt des aus definierten Positionen erstellten Würfels für den jeweiligen Abschnitt und Zeitraum enthalten sind, werden gezählt, alle Variablen und Zusammenfassungsfeld-Statistiken werden berechnet, und mithilfe der Mann-Kendall-Statistik wird der Trend für die Abschnitte im Zeitverlauf für jede Position ermittelt.

Wenn Sie über ein multidimensionales Raster verfügen und mit den Werkzeugen in der Toolbox "Space Time Pattern Mining" eine Raum-Zeit-Analyse durchführen möchten, konvertieren Sie das multidimensionale Raster mithilfe des Werkzeugs Raum-Zeit-Würfel aus multidimensionalem Raster-Layer erstellen in einen Raum-Zeit-Würfel. Wenn die Rasterzellen Quadrate sind (also die Zellengrößen für X und Y identisch sind), ist der Ausgabe-Raum-Zeit-Würfel ein Grid-Würfel. Bei rechteckigen Rasterzellen ist der Ausgabe-Raum-Zeit-Würfel ein Würfel mit definierten Positionen. Der Ausgabe-Raum-Zeit-Würfel verfügt über die gleiche räumliche und zeitliche Auflösung wie das multidimensionale Raster, in dem jede Raster-Zelle jeder Dimension in einen einzelnen Raum-Zeit-Abschnitt konvertiert wird. Trends in den Werten im Zeitverlauf werden anhand der Mann-Kendall-Statistik ermittelt. Die meisten Informationen in diesem Thema gelten nicht für dieses Werkzeug, da die Struktur des Raum-Zeit-Würfels durch die Struktur des multidimensionalen Rasters definiert wird und nicht geändert werden kann.

Festlegen der Struktur des Würfels

In den meisten Fällen wissen Sie, wie die Dimensionen der Würfelabschnitte festzulegen sind, und es empfiehlt sich, darüber nachzudenken, welche Dimensionen für die Beantwortung der jeweiligen Fragestellung geeignet sein könnten. Wenn Sie Verbrechen untersuchen, könnten Sie beispielsweise Punkte in 400-m-Abschnitte aggregieren, da dies in etwa einer Straßenlänge in einem Stadtviertel entspricht. Wenn Ihnen die Daten eines ganzen Jahres vorliegen, könnten Sie Trends untersuchen, deren Ereignisse monatlich oder wöchentlich zusammengefasst wurden.

Grid-Würfel

Die Struktur des Würfels umfasst Zeilen, Spalten und Zeitschritte. Multipliziert man die Anzahl der Zeilen mit der Anzahl der Spalten und der Anzahl der Zeitschritte, erhält man die Gesamtanzahl der Abschnitte des Würfels. Mit den Zeilen und Spalten wird die räumliche Ausdehnung und mit den Zeitschritten die zeitliche Ausdehnung des Würfels bestimmt.

Positionen

Würfel mit definierten Positionen

Die Struktur des Würfels umfasst Features und Zeitschritte. Wenn Sie die Anzahl der Features mit der Anzahl der Zeitschritte multiplizieren, erhalten Sie die Gesamtanzahl der Abschnitte in dem Würfel. Die räumliche Ausdehnung des Würfels wird durch die Features bestimmt, während sich die zeitliche Ausdehnung aus den Zeitschritten ergibt.

Multidimensionaler Raster-Layer-Würfel

Die Würfelstruktur verfügt über die gleiche Anzahl von Features und Zeitdimensionen wie die Anzahl der Zellen und Dimensionen des multidimensionalen Raster-Layers.

Räumliche Struktur

Räumliche Standardwerte für den Grid-Würfel

Falls die Gittergröße Ihres Grid-Würfels keine Rolle spielt, lassen Sie den Parameter Entfernungsintervall leer. Die Standardwerte werden dann vom Werkzeug berechnet.

Die Standard-Abschnittsentfernung wird berechnet, indem zunächst die Entfernung der längsten Seite der Ausdehnung Eingabe-Features (maximale Ausdehnung) bestimmt wird. Die Abschnittsentfernung ist dann der größere Wert der maximalen Ausdehnung dividiert durch 100 oder einem Algorithmus, der auf der räumlichen Verteilung der Eingabe-Features basiert.

Räumliche Struktur des aus definierten Positionen bestehenden Würfels

Die räumliche Struktur des Würfels aus definierten Positionen besteht aus den angegebenen Positionen.

Räumliche Struktur des multidimensionalen Raster-Layer-Würfels

Die räumliche Struktur des Würfels wird durch die räumliche Ausdehnung und Auflösung des multidimensionalen Raster-Layers definiert.

Zeitliche Struktur

Zeitliche Standardwerte für den Grid-Würfel

Falls die Länge der Zeitschritte keine große Rolle spielt, lassen Sie den Parameter Zeitschrittintervall leer. Die Standardwerte werden dann vom Werkzeug berechnet. Das Standard-Zeitschrittintervall basiert auf zwei unterschiedlichen Algorithmen, mithilfe derer die optimale Anzahl und der Abstand der Zeitschrittintervalle bestimmt werden. Das kleinere numerische Ergebnis aus diesen Algorithmen, insofern es größer als 10 ist, wird als die Standardanzahl an Zeitintervallen herangezogen. Sind beide numerischen Ergebnisse kleiner als 10, wird 10 als Standardwert für die Anzahl der Zeitintervalle festgelegt.

Zeitliche Struktur des aus definierten Positionen bestehenden Würfels

Sie müssen die zeitliche Struktur des aus definierten Positionen bestehenden Würfels angeben. Wenn die Erfassung der Daten beispielsweise alle fünf Jahre erfolgt, geben Sie dies im Parameter Zeitschrittintervall an.

Sie können auch eine vorübergehende zeitliche Aggregierung in dem aus definierten Positionen bestehenden Würfel vornehmen. Wenn Sie beispielsweise über Stationen verfügen, die alle fünf Minuten die aktuelle Feuchtigkeit aufzeichnen, kann es sinnvoll sein, Zeitliche Aggregation auszuwählen, damit diese Ableseergebnisse in stündliche Mittelwerte zusammengefasst werden.

Bei der zeitlichen Aggregation können Sie die Aggregation bewerten, indem Sie jedem Abschnitt die Anzahl der aggregierten Features zuordnen. Wenn Ihnen beispielsweise Daten vorliegen, die alle fünf Minuten erfasst wurden, und Sie diese in Form von stündlichen Mittelwerten zusammenfassen, dann können Sie davon ausgehen, dass in jedem Abschnitt 12 Features pro Stunde aggregiert werden. Wenn Sie das Werkzeug Raum-Zeit-Würfel in 3D visualisieren zur Darstellung der Würfel-Variablen Anzahl zeitliche Aggregation verwenden und Ihnen Abschnitte begegnen, die weniger als 12 Werte enthalten, dann folgt daraus, dass manche Feuchtigkeitswerte nicht erfasst wurden. Dies stellt nicht notwendigerweise ein Problem dar, trägt aber zum Verständnis bei, wenn bei einem der Sensoren ein Problem auftritt oder wenn für eine Position zu wenige Daten für den Zeitraum vorliegen, um in die Analyse aufgenommen zu werden.

Zeitliche Struktur des multidimensionalen Raster-Layer-Würfels

Die zeitliche Struktur des Würfels wird durch die Zeitdimensionen des multidimensionalen Raster-Layers definiert.

Zeitschrittausrichtung

Wenn Sie einen Würfel aus definierten Positionen ohne zeitliche Aggregation erstellen, müssen Sie lediglich Werte für Zeitschrittintervall, Zeitschrittausrichtung und Bezugszeit angeben, um sicherzustellen, dass jeder Abschnitt nur genau einen Eintrag enthält. Das Problem einer zeitlichen Verzerrung ist nicht gegeben.

Wenn Sie keine Aggregation durchführen und monatliche Zeitschrittintervalle erstellen möchten, wobei Ihre Daten erfassungsbedingt jeweils zwischen dem 1. und 6. eines Monats liegen, dann hat es sich bewährt, als Zeitschrittausrichtung die Option Bezugszeit zu verwenden und ein Datum zu wählen, mit dem sichergestellt wird, dass im zurückliegenden und vorausliegenden Monat alle Datenpunkte erfasst werden. Wenn Sie beispielsweise über Daten am 01.01., 03.02., 02.03., 01.04. und 03.05. verfügen, wird durch die Auswahl einer Bezugszeit am ersten jedes Monats in Ihrem Dataset sichergestellt, dass alle Daten korrekt im resultierenden Würfel enthalten sind.

Wenn Sie Ihre Daten in einen Raum-Zeit-Würfel aggregieren, ist die Zeitschrittausrichtung ein wichtiger zu berücksichtigender Parameter, denn damit wird festgelegt, wo die Aggregation beginnt und endet. Beispiel:

Beispieldaten für Zeitschrittausrichtung
In der Abbildung oben ist ein Dataset mit einer Zeitspanne vom 3. September 2015 bis zum 12. September 2015 dargestellt. Anhand dieses Datasets sollen die Auswirkungen der verschiedenen Parameteroptionen verdeutlicht werden.

Endzeit

Wenn beispielsweise der Wert Endzeit als Zeitschrittausrichtung und ein Zeitschrittintervall von drei Tagen festgelegt wird, startet die Klasseneinteilung mit dem letzten Datenpunkt und geht in Schritten von drei Tagen zurück, bis alle Daten in einen Zeitschritt fallen.

Aggregation mit Endzeitausrichtung des Datasets

Hierbei ist zu beachten, dass es je nach ausgewähltem Wert für Zeitschrittintervall möglich ist, einen Zeitschritt am Anfang des Raum-Zeit-Würfels zu erstellen, der im gesamten Zeitraum keine Daten aufweist. Im obigen Beispiel sind 1.9. und 2.9. im ersten Zeitschritt enthalten, obwohl bis 3.9. keine Daten vorhanden sind. Diese leeren Tage sind Teil des Zeitschritts, sie sind jedoch mit keinen Daten verknüpft. Dadurch können Ihre Ergebnisse verzerrt werden, da der vorübergehend verzerrte Zeitschritt deutlich weniger Punkte aufzuweisen scheint als andere Zeitschritte, was jedoch ein künstliches Ergebnis des Aggregationsschemas ist. Der Bericht gibt an, ob eine zeitliche Verzerrung im ersten oder letzten Zeitschritt vorhanden ist. In diesem Fall weisen zwei von drei Tagen im ersten Zeitschritt keine Daten auf, sodass die zeitliche Verzerrung 66 Prozent beträgt.

Endzeit ist die Standardoption für Zeitschrittausrichtung, da der Fokus vieler Analysen auf den letzten Vorgängen liegt, sodass eine Verzerrung in Richtung Beginn des Würfels vorzuziehen ist. Eine andere Lösung ohne zeitliche Verzerrung ist die Bereitstellung von Daten, die gleichmäßig auf das Zeitschrittintervall verteilt sind, sodass keine Zeiträume verzerrt sind. Hierzu können Sie einen Auswahlsatz der Daten erstellen, der den Teil des Punkt-Datasets ausschließt, der sich außerhalb des Zeitraums befindet, den Sie als ersten Zeitraum festlegen möchten. In diesem Beispiel kann das Problem gelöst werden, indem alle Daten, ausgenommen die Daten bis einschließlich 3.9., ausgewählt werden. Der Bericht zeigt die Zeitspanne des ersten und letzten Zeitschritts an. Anhand dieser Informationen kann das Datum für die Teilung ermittelt werden.

Wenn der Start des letzten Abschnitts beim zeitlichen Zurückgehen zufällig genau auf den ersten Datenpunkt fällt, muss außerdem beachtet werden, dass der letzte Datenpunkt nicht in diesen Abschnitt einbezogen wird. Dies ist darauf zurückzuführen, dass beim Wert Endzeit für Zeitschrittausrichtung jeder Abschnitt das letzte Datum eines angegebenen Abschnitts enthält, jedoch nicht das erste Datum in diesem Abschnitt, obwohl er bis dorthin zurückreicht. In diesem Fall muss daher ein zusätzlicher Abschnitt hinzugefügt werden, um sicherzustellen, dass der erste Datenpunkt einbezogen wird.

Startzeit

Wenn beispielsweise der Wert Startzeit als Zeitschrittausrichtung und ein Zeitschrittintervall von drei Tagen festgelegt wird, startet die Klasseneinteilung mit dem ersten Datenpunkt und geht in Schritten von drei Tagen nach vorn, bis das letzte Datum in den letzten Zeitschritt fällt.

Aggregation mit Startzeitausrichtung des Datasets

Es müssen einige Punkte berücksichtigt werden. Bei der Auswahl des Wertes Startzeit für die Zeitschrittausrichtung ist je nach ausgewähltem Zeitschrittintervall zu beachten, dass möglicherweise am Ende des Raum-Zeit-Würfels ein Zeitschritt erstellt wird, der im gesamten Zeitraum keine Daten aufweist. Im obigen Beispiel sind 13.9. und 14.9. im letzten Zeitschritt enthalten, obwohl nach 12.9. keine Daten vorhanden sind. Diese leeren Tage sind Teil des Zeitschritts, sie sind jedoch mit keinen Daten verknüpft. Dadurch können Ihre Ergebnisse verzerrt werden, da der vorübergehend verzerrte Zeitschritt deutlich weniger Punkte aufzuweisen scheint als andere Zeitschritte, was jedoch ein künstliches Ergebnis des Aggregationsschemas ist. Der Bericht gibt an, ob eine zeitliche Verzerrung im ersten oder letzten Zeitschritt vorhanden ist. In diesem Fall weisen zwei von drei Tagen im letzten Zeitschritt keine Daten auf, sodass die zeitliche Verzerrung 66 Prozent beträgt. Dies ist besonders dann problematisch, wenn der Wert Startzeit für die Zeitschrittausrichtung ausgewählt wird, da Analysen mit Fokus auf den aktuellen Daten deutlich beeinflusst werden können. Die Lösung besteht darin, Daten bereitzustellen, die gleichmäßig auf das Zeitschrittintervall verteilt sind, sodass keine Zeiträume verzerrt sind. Hierzu können Sie einen Auswahlsatz der Daten erstellen, der den Teil des Punkt-Datasets ausschließt, der sich außerhalb des Zeitraums befindet, den Sie als letzten Zeitraum festlegen möchten. In diesem Beispiel kann das Problem gelöst werden, indem alle Daten, ausgenommen die Daten ab 12.9., ausgewählt werden. Sie können auch zwei Tage zu Anfang des Datasets entfernen, was ebenfalls dazu führt, dass die Daten gleichmäßig in den Zeitschritten liegen. Der Bericht zeigt die Zeitspanne des ersten und letzten Zeitschritts an. Anhand dieser Informationen kann das Datum für die Teilung ermittelt werden.

Wenn das Ende des letzten Zeitschritts beim zeitlichen Vorwärtsgehen genau auf den letzten Datenpunkt fällt, muss außerdem beachtet werden, dass der letzte Datenpunkt nicht in diesen Abschnitt einbezogen wird. Dies ist darauf zurückzuführen, dass beim Wert Startzeit für Zeitschrittausrichtung jeder Abschnitt das erste Datum eines angegebenen Abschnitts enthält, jedoch nicht das letzte Datum in diesem Abschnitt, obwohl er bis dorthin reicht. In diesem Fall muss daher ein zusätzlicher Abschnitt hinzugefügt werden, um sicherzustellen, dass der letzte Datenpunkt einbezogen wird.

Bezugszeit

Mit dem Wert Bezugszeit für Zeitschrittausrichtung können Sie sicherstellen, dass ein bestimmtes Datum den Anfang oder das Ende eines der Zeitschritte im Würfel darstellt.

Wenn eine Bezugszeit ausgewählt wird, die nach der Ausdehnung des Datasets, auf dem letzten Datenpunkt oder in der Mitte des Datasets liegt, wird sie wie der letzte Datenpunkt eines Zeitschritts behandelt; alle anderen Abschnitte auf beiden Seiten werden mit der Zeitschrittausrichtung erstellt, bis alle Daten abgedeckt sind:

Verwenden einer Bezugszeit mit einer Endzeitausrichtung

Wenn eine Bezugszeit ausgewählt wird, die vor der Ausdehnung des Datasets oder auf dem ersten Datenpunkt liegt, wird sie wie der erste Datenpunkt eines Zeitschritts behandelt; alle anderen Zeitschritte auf beiden Seiten werden mit dem Wert Startzeit für Zeitschrittausrichtung erstellt, bis alle Daten abgedeckt sind:

Verwenden einer Bezugszeit mit einer Startzeitausrichtung

Bei Auswahl eines Wertes für Bezugszeit vor oder nach der zeitlichen Ausdehnung der Daten können möglicherweise leere oder teilweise leere Abschnitte erstellt werden, die Ihre Analyse verzerren.

Vorlagen-Würfel für Grid-Würfel

Hinweis:

Ein Vorlagewürfel kann nicht mit Würfeln aus definierten Positionen verwendet werden, sondern er eignet sich nur für Grid-Würfel.

Wenn Sie einen Wert für Vorlagewürfel auswählen, können Sie eine konsistente räumliche Ausdehnung und einen Wert für das Zeitschrittintervall auswählen, während Sie andere Datasets analysieren. Sie können beispielsweise den Raum-Zeit-Würfel des letzten Jahres als Vorlagewürfel verwenden, sobald Ihnen die Daten des nächsten Jahres vorliegen. Dadurch wird die Konsistenz in der verwendeten räumlichen Ausdehnung und dem Zeitschrittintervall sichergestellt und gleichzeitig die Ausdehnung des Würfels auf die neuen Daten erweitert. Sie haben auch die Möglichkeit, den Raum-Zeit-Würfel für einen bestimmten Ereignistyp als Vorlagewürfel für die Analyse eines anderen Ereignistyps heranzuziehen. So können Sie sicherstellen, dass der Vergleich der Analyseergebnisse stichhaltig ist.

Die Auswahl eines Wertes für Vorlagewürfel hat Auswirkungen auf die Option Zeitschrittausrichtung. Wenn Sie einen Wert für den Vorlagewürfel auswählen, der vor oder nach der Zeitspanne der Eingabe-Features liegt, werden Zeitschritte hinzugefügt, bis alle Daten durch einen Zeitschritt abgedeckt sind. Dazu wird der Wert für die Zeitschrittausrichtung des Vorlagewürfels verwendet. Der resultierende Raum-Zeit-Würfel weist dort leere Würfel auf, wo der Wert für den Vorlagewürfel die Eingabe-Features nicht zeitlich überlappt. Dadurch können die Ergebnisse der Analyse verzerrt werden. Wenn der Vorlagewürfel die Eingabe-Features überlappt, deckt der Raum-Zeit-Würfel die zeitliche Ausdehnung des Vorlagewürfels ab und dehnt sich aus, bis alle Eingabe-Features abgedeckt sind. Dazu wird die Zeitschrittausrichtung des Vorlagewürfels verwendet. In der Abbildung unten sind Vorlagen-Würfel blau und die erzeugten Raum-Zeit-Würfel orangefarben dargestellt.

Beispiele für Vorlagen-Würfel

Hierbei ist zu beachten, dass beim Erstellen eines Raum-Zeit-Würfels mit der Option Vorlagewürfel die zeitliche Ausdehnung des Vorlagewürfels ausgedehnt wird, bis alle Daten abgedeckt sind. So können Sie aus dem Würfel des letzten Jahres einen Würfel erstellen, der sowohl die Daten des Vorjahres als auch des aktuellen Jahres enthält. Die räumliche Ausdehnung des Vorlagewürfels wird anders behandelt. Alle Daten, die außerhalb der räumlichen Ausdehnung des Vorlagewürfels liegen, werden aus der Analyse ausgeschlossen. Der Vorlagewürfel und der resultierende Raum-Zeit-Würfel weisen identische räumliche Ausdehnungen auf. Änderungen können nur in der räumlichen Ausdehnung vorkommen, in der Positionen, die zuvor keine Daten aufwiesen, zu Positionen mit Daten werden können. Dies ist der Fall, wenn neue Features auftreten, die bei der Erstellung des Vorlagenwürfels nicht vorhanden waren.

Attribute

Punkte aggregieren

Wenn ein Würfel durch die Aggregation von Punkten erstellt wird – ob Grid-Würfel oder ein Würfel aus definierten Positionen –, wird stets das Feld COUNT mit der Anzahl an Punkten in jedem Abschnitt berechnet. Neben dem Feld COUNT lassen sich auch die Attribute jedes Abschnitts zusammenfassen. Es können mehrere Statistik- und Feldkombinationen angegeben werden. NULL-Werte sind von allen statistischen Berechnungen ausgeschlossen. Bei der Auswahl von Zusammenfassungsfeldern muss jede Position für jedes Attribut an jedem Zeitschritt einen Wert aufweisen. Mithilfe des Parameters Leere Abschnitte füllen mit können Sie festlegen, wie leere Abschnitte (Abschnitte ohne Punkte und somit ohne Attributwerte) vom Werkzeug ausgefüllt werden sollen. Es stehen mehrere Optionen zur Verfügung, und Sie können für jedes Feld, das zusammengefasst werden soll, einen anderen Fülltyp auswählen. Alle Abschnitte, die nicht basierend auf den Schätzungskriterien gefüllt werden können, führen dazu, dass die gesamte Position aus der Analyse ausgeschlossen wird. Zum Füllen leerer Abschnitte mit dem Durchschnittswert räumlicher Nachbarn sind mindestens vier räumliche Nachbarn und zum Füllen leerer Abschnitte mit dem Durchschnittswert von Raum-Zeit-Nachbarn sind mindestens 13 Nachbarn erforderlich.

Definierte Positionen

Beim Erstellen eines Würfels aus definierten Positionen, die keine zeitliche Aggregation aufweisen, wählen Sie diejenigen Variablen aus Ihren Daten aus, die im Würfel enthalten sein sollen, dazu legen Sie eine Option Leere Abschnitte füllen mit fest, die besonders dann verwendet werden sollte, wenn bestimmte Zeitabschnitte des Datasets NULL-Werte oder unausgefüllte Features aufweisen und diese Positionen nicht wegfallen sollen.

Beim Erstellen eines Würfels aus definierten Positionen mit zeitlicher Aggregation müssen Sie diejenigen Zusammenfassungsfelder auswählen, die im resultierenden Würfel enthalten sein sollen, sowie einen Statistiktyp festlegen, der zum Zusammenfassen verwendet werden soll. Da jede Position an jedem Zeitschritt einen Wert aufweisen muss, müssen Sie neben dem Statistiktyp außerdem mithilfe des Parameters Leere Abschnitte füllen mit festlegen, wie die Zeitserie ausgefüllt werden soll. Es stehen mehrere Optionen zur Verfügung, und Sie können für jedes Feld, das zusammengefasst werden soll, einen anderen Fülltyp auswählen.

Statistiktypen (aus definierten Positionen und durch das Aggregieren von Punkten erstellte Würfel)

Die folgenden Statistiktypen sind verfügbar:

  • Summe: Der Gesamtwert für das angegebene Feld in jedem Abschnitt wird hinzugefügt.
  • Mittelwert: Der Mittelwert für das angegebene Feld in jedem Abschnitt wird berechnet.
  • Minimum: Der kleinste Wert aller Datensätze des angegebenen Feldes in jedem Abschnitt wird ermittelt.
  • Maximum: Der größte Wert aller Datensätze des angegebenen Feldes in jedem Abschnitt wird ermittelt.
  • Standardabweichung: Die Standardabweichung der Werte im angegebenen Feld in jedem Abschnitt wird ermittelt.
  • Medianwert: Der sortierte Mittelwert aller Datensätze des angegebenen Feldes in jedem Abschnitt wird ermittelt.

Vorsicht:

NULL-Werte, die sich in den Zusammenfassungsfeldern befinden, führen dazu, dass diese Features aus der Analyse ausgeschlossen werden. Wenn es Teil Ihrer Analysestrategie ist, dass in jedem Abschnitt die Anzahl der Punkte enthalten ist, können Sie getrennte Würfel erstellen, einen für die Anzahl (ohne Zusammenfassungsfelder) und einen für Zusammenfassungsfelder. Wenn der Satz von NULL-Werten für jedes Zusammenfassungsfeld unterschiedlich ist, können Sie auch einen getrennten Würfel für jedes Zusammenfassungsfeld erstellen.

Leere Abschnitte füllen mit (für alle Würfel)

Die verfügbaren Fülltypen lauten:

  • Nullen: Leere Abschnitte werden mit Nullen gefüllt.
  • Räumliche Nachbarn: Leere Abschnitte werden mit dem Durchschnittswert von räumlichen Nachbarn gefüllt.
  • Raum-Zeit-Nachbarn: Leere Abschnitte werden mit dem Durchschnittswert von Raum-Zeit-Nachbarn gefüllt.
  • Zeitlicher Trend: Leere Abschnitte werden anhand eines interpolierten eindimensionalen Spline-Algorithmus gefüllt.

Zudem gibt es bei der Verwendung des Werkzeugs Raum-Zeit-Würfel aus definierten Positionen erstellen die zusätzliche Option Positionen entfernen, um Positionen ohne vollständige Zeitserie auszuschließen, anstatt sie mit einer der obigen Optionen zu füllen.

Interpretieren der Ergebnisse

Meldungen

Während der Ausführung des Werkzeugs werden unten im Bereich Geoverarbeitung zusätzlich zur netCDF-Datei Meldungen angezeigt, die eine Zusammenfassung der Raum-Zeit-Würfel-Dimensionen und -Inhalte enthalten. Um auf die Meldungen zuzugreifen, zeigen Sie mit der Maus auf die Fortschrittsleiste, und klicken Sie auf die Pop-out-Schaltfläche Pop-out, oder erweitern Sie den Abschnitt "Meldungen" im Bereich Geoverarbeitung. Sie können auch auf die Meldungen für ein zuvor ausgeführtes Werkzeug über den Geoverarbeitungsverlauf zugreifen.

Bei der Analyse von Grid-Würfeln werden lediglich Positionen mit Daten für mindestens ein Zeitintervall berücksichtigt, sie werden jedoch über alle Zeitschritte hinweg analysiert. Beim Berechnen der Punktanzahl in einem Grid-Würfel werden für Abschnitte, die keine Punkte enthalten, deren zugeordnete Position jedoch bei mindestens einem Zeitintervall mindestens einen Punkt aufzuweisen hatte, Punktzahlen von Null angenommen. Angaben zum prozentualen Anteil von Nullen, die Positionen zugeordnet sind, die für mindestens ein Zeitintervall Daten enthalten, werden in den Meldungen als "geringe Dichte" angegeben.

Bei definierten Positionen werden alle Positionen mit einer vollständigen Zeitserie in den aus definierten Positionen erstellten Würfel aufgenommen, selbst wenn diese Zeitserie zur Gänze aus Nullen besteht. Dies ist insbesondere bei Punkten wichtig, die in definierte Positionen aggregiert wurden.

Am Ende der Ausgabemeldung finden Sie die Information "Datentrend Gesamt". Dieser Trend basiert auf der Analyse einer lageunabhängigen Zeitserie. Diese beantwortet allgemein die Frage, ob die von den Eingabepunkten repräsentierten Ereignisse im Zeitverlauf zunehmen oder abnehmen. Zur Beantwortung dieser Frage werden alle Positionen in jedem Zeitintervall in Form einer Zeitserie gemeinsam mithilfe der Mann-Kendall-Statistik analysiert.

Trendanalyse

Die Mann-Kendall-Trendanalyse kommt bei jeder Position, die Daten enthält, als Zeitserientest für unabhängige Abschnitte zum Einsatz. Die Mann-Kendall-Statistik stellt eine Rangstufenkorrelationsanalyse für die Abschnittszählung bzw. -werte und deren zeitliche Abfolge dar. Der Abschnittswert des ersten Zeitraums wird mit dem Abschnittswert des zweiten verglichen. Wenn der erste kleiner ist als der zweite, lautet das Ergebnis +1. Wenn der erste größer ist als der zweite, lautet das Ergebnis -1. Wenn die zwei Werte gleichwertig sind, lautet das Ergebnis 0. Die Ergebnisse für jedes verglichene Zeitraumpaar werden addiert. Die erwartete Summe beträgt 0, woraus hervorgeht, dass die Werte im zeitlichen Verlauf keinen Trend aufweisen. Auf der Grundlage der Varianz der Werte in der Abschnitts-Zeitserie, der Anzahl der Gleichstände und der Anzahl der Zeiträume wird die beobachtete Summe mit der erwarteten Summe (0) verglichen, um zu ermitteln, ob die Differenz statistisch signifikant ist. Der Trend für jede Abschnitts-Zeitserie wird als Z-Wert und p-Wert vermerkt. Ein kleiner p-Wert gibt an, dass der Trend statistisch signifikant ist. Das Vorzeichen des Z-Werts lässt erkennen, ob der Trend eine Zunahme (positiver Z-Wert) oder Abnahme (negativer Z-Wert) der Abschnittswerte darstellt. Strategien zur Visualisierung der Trendergebnisse werden unter Raum-Zeit-Würfel visualisieren beschrieben.

Datenstruktur des Raum-Zeit-Würfels

Visualisierung

Sie können die Daten des Raum-Zeit-Würfels mithilfe der Werkzeuge im Toolset "Dienstprogramme" oder durch Herunterladen von Space Time Cube Explorer in 2D oder 3D visualisieren. Der Space Time Cube Explorer ermöglicht die schnelle Visualisierung und Untersuchung und Erkundung Ihrer 3D-Space Time Pattern Mining-Analyseergebnisse. In diesem Add-in wird Ihr Raum-Zeit-Würfel als Eingabe verwendet, und es werden Layer erstellt, die auf unterschiedlichste Weise visualisiert werden können. Es gibt viele verschiedene Anzeigeoptionen, alle mit vordefinierter Symbolisierung und Zeitschiebereglern, die eine intuitive Untersuchung des Raum-Zeit-Würfels und der Analyseergebnisse ermöglichen. Sie können das Add-in von www.esriurl.com/SpaceTimeCubeExplorer herunterladen. Dreidimensionale Visualisierungen des Raum-Zeit-Würfels können auch als Webszenen angezeigt und in Story-Maps freigegeben werden.

Zusätzliche Quellen

Bei der Erstellung, Visualisierung und Analyse des Raum-Zeit-Würfels wird die von UCAR/Unidata entwickelte netCDF-Software verwendet. Weitere Informationen zu Unidata und dem NetCDF (Network Common Data Form)-Projekt.

Weitere Informationen zur Optimierung der Histogramm-Abschnittsbreite finden Sie hier:

  • Shimazaki H. und S. Shinomoto, "A method for selecting the bin size of a time histogram," Neural Computation, Bd. 19(6), (2007): 1503–1527.
  • Terrell, G. und D. Scott, "Oversmoothed Nonparametric Density Estimates," Journal of the American Statistical Association, Bd. 80(389), (1985): 209-214.
  • Online-Statistik-Lernprogramm: Ein Multimedia-Kurs (http://onlinestatbook.com/). Projektleiter: David M. Lane, Rice University (Kapitel 2, "Graphing Distributions, Histograms" [Diagrammverteilungen, Histogramme]).

Weitere Informationen zum Mann-Kendall-Trendtest finden Sie hier:

  • Hamed, K. H., "Exact distribution of the Mann-Kendall trend test statistic for persistent data," Journal of Hydrology (2009): 86–94.
  • Kendall, M. G. and J. D. Gibbons, Rank correlation methods, 5. Aufl., (1990) Griffin, London.
  • Mann, H. B., "Nonparametric tests against trend," Econometrica Bd. 13, (1945): 245–259.