Funktionsweise der Zeitserien-Kreuzkorrelation

Das Werkzeug Zeitserien-Kreuzkorrelation vergleicht zwei Zeitserien (die so genannten primären und sekundären Analysevariablen) an jeder Position eines Raum-Zeit-Würfels, indem es einen Pearson-Korrelationskoeffizienten zwischen den entsprechenden Werten bei jedem Zeitschritt berechnet. Zusätzlich wird die sekundäre Analysevariable gegenüber der primären Analysevariable zeitverzögert (zeitlich verschoben), und es werden neue Korrelationen für verschiedene Zeitverzögerungen berechnet. Auf diese Weise können Sie verzögerte Effekte zwischen den primären und sekundären Analysevariablen abschätzen, z. B. eine Verzögerung zwischen einer Marketingkampagne und einem Anstieg der Umsatzerlöse. Wenn beispielsweise Marketing und Vertrieb am stärksten korreliert sind, wenn der Umsatzerlös um eine Woche nach hinten verschoben ist, bedeutet dies, dass zwischen dem Anstieg der Marketingaktivitäten und dem Anstieg des Umsatzerlöses eine Verzögerung von einer Woche besteht.

Das Werkzeug kann als beschreibende Methode und Analysemethode verwendet werden, um die direkte Korrelation zwischen den Zeitserien zu berechnen. Es kann auch als Analyse- und schlussfolgernde Methode verwendet werden, indem Trends bereinigt und die Autokorrelation gefiltert wird, um die statistische Abhängigkeit zwischen den beiden Variablen zu isolieren. Sie können auch Nachbarn in die Berechnungen einbeziehen, um die Ähnlichkeit zwischen den Zeitserien benachbarter Positionen zu berücksichtigen und räumliche Effekte und Wechselwirkungen zu erfassen.

Potenzielle Anwendungsbereiche

Im Folgenden werden beispielhaft einige Anwendungsbereiche des Werkzeugs vorgestellt:

  • Vergleichen der stündlichen Temperaturen in einem Ballungsgebiet mit dem Stromverbrauch, um sich auf die Stromspitzen während der heißesten Stunden eines jeden Tages vorzubereiten.
  • Abschätzen der Verzögerung zwischen dem Anstieg der Niederschlagsmenge und dem Anstieg des Wasservolumens im Stausee. Wie lange dauert es nach dem Höhepunkt eines Regens, bis die Wasserstände in den Stauseen am schnellsten ansteigen? Ist die Dauer der Verzögerung an Orten mit unterschiedlichen Bodenverhältnissen unterschiedlich?
  • Vergleich der Wirksamkeit verschiedener Marketingkampagnen, um festzustellen, welche Ausgaben für die Kampagne sich am positivsten auf die Umsatzerlöse auswirken. Außerdem können Sie die Verzögerung zwischen Marketingausgaben und Kundenkäufen abschätzen. Braucht es bei manchen Kampagnen länger, bis sie zu Verkäufen führen, sind sie dann aber letztendlich am effektivsten, um langfristige Umsätze zu erzielen?

Kreuzkorrelation

Kreuzkorrelationswerte messen die Stärke der linearen Beziehung zwischen zwei Zeitserien: Wenn eine Zeitserie zunimmt, nimmt dann die andere tendenziell zu, ab oder bleibt sie unverändert? Kreuzkorrelationen nahe dem Wert 1 bedeuten, dass sich die beiden Zeitserien in dieselbe Richtung und in denselben Proportionen bewegen. So sind beispielsweise die Zahl der Fluggäste und die Flugpreise stark positiv korreliert: Wenn mehr Menschen reisen, sind die Flugpreise höher. Gleichermaßen bedeuten negative Kreuzkorrelationen, dass sich die beiden Zeitserien in entgegengesetzte Richtungen bewegen, wie z. B. die Zahl der freien Parkplätze und das Verkehrsaufkommen auf der Straße (der Verkehr nimmt zu, wenn es weniger Parkplätze gibt). Wenn zwei Zeitserien nicht miteinander in Beziehung stehen und nicht dazu neigen, sich in ähnliche oder unterschiedliche Richtungen zu verändern, ist die Kreuzkorrelation nahe dem Wert Null.

Zeitverzögerungen

Da die Auswirkungen bei zwei Zeitserien häufig verzögert sind (z. B. die Verzögerung zwischen einer Zunahme der Zahl der Raubtiere in einem Ökosystem und Veränderungen in der Population der Beutetiere), wird bei der Berechnung der Werte der Kreuzkorrelation immer eine zeitliche Verzögerung berücksichtigt. Die Zeitverzögerung ist eine Verschiebung der Sekundärvariablen gegenüber der Primärvariablen, und für die neuen entsprechenden Wertepaare zwischen den beiden Zeitserien wird ein neuer Kreuzkorrelationswert berechnet.

In der folgenden Abbildung zeigt das obere Diagramm die Primär- und Sekundäranalysevariablen. Das mittlere Diagramm zeigt die sekundäre Variable um zwei Zeitschritte vor verschoben (Zeitverzögerung 2), das untere Diagramm zeigt die sekundäre Variable um zwei Zeitschritte zurück verschoben (Zeitverzögerung -2). Da die sekundäre Variable anscheinend zu- oder abnimmt, nachdem die primäre Variable zu- oder abgenommen hat, erhöht eine zeitliche Verzögerung der sekundären Variable (negative Zeitverzögerung) die Kreuzkorrelation zwischen den Variablen. Beachten Sie zudem, dass einige der Zeitschritte an den Enden der Zeitserie der Primärvariablen nach der Verschiebung keinen entsprechenden Wert in der Sekundärvariablen mehr aufweisen.

Die Sekundärvariable wird relativ zur Primärvariablen verschoben.

Ist die Zeitverzögerung mit der stärksten Korrelation positiv, treten Änderungen des Wertes der sekundären Analysevariable vor den Änderungen in der primären Analysevariable auf. Ist die Zeitverzögerung mit der stärksten Korrelation negativ, treten Änderungen in der primären Analysevariable vor den Änderungen in der sekundären Analysevariable auf.

Das Werkzeug berechnet Kreuzkorrelationen für alle Zeitverzögerungen zwischen Null und dem Wert des Parameters Maximale Zeitverzögerung. Zusätzlich kann mit dem Parameter Verzögerungsrichtung der sekundären Variable die Richtung der Verschiebung angegeben werden (d. h. das Vorzeichen der Zeitverzögerung). Sie können die sekundäre Analysevariable in beide Richtungen verschieben, in der Zeit nach hinten (negative Zeitverzögerung) oder in der Zeit nach vorne (positive Zeitverzögerung). Wird beispielsweise eine maximale Zeitverzögerung von 10 und eine Verschiebung in beide Richtungen verwendet, werden Kreuzkorrelationen für alle Zeitverzögerungen zwischen -10 und 10 berechnet. Entsprechend werden bei einer maximalen Zeitverzögerung von 5 und einer Verschiebung nur nach hinten Kreuzkorrelationen für alle Zeitverzögerungen zwischen -5 und 0 berechnet.

Hinweis:

Wenn für den Parameter Maximale Zeitverzögerung kein Wert angegeben wird, beträgt die maximale Zeitverzögerung 10*log10(T/2) für T Zeitschritte in jeder Zeitserie (abgerundet). Der Wert darf maximal (T-5) sein. Bei einem Wert von Null wird nur die direkte Kreuzkorrelation der beiden Zeitserien ohne Zeitverzögerung berechnet.

Einbeziehen räumlicher Nachbarn

Um die Schätzung der Kreuzkorrelation zu verbessern, können Sie den Parameter Räumliche Nachbarn in Berechnungen einbeziehen zum Definieren einer Nachbarschaft um jede Position verwenden. Wenn Nachbarn einbezogen werden, ist die Kreuzkorrelation jeder Position für eine gegebene Zeitverzögerung der (ggf. gewichtete) Durchschnitt der Kreuzkorrelationen zwischen der primären Analysevariablen der Schwerpunktposition und der zeitverzögerten sekundären Analysevariablen jedes räumlichen Nachbarn (und sich selbst).

In der nachstehenden Abbildung ist beispielsweise die Schwerpunktposition in Rot mit acht Nachbarn dargestellt. Die orangefarbene Zeitserie ist die primäre Analysevariable der Schwerpunktposition, und die violetten Zeitserien sind die sekundären Analysevariablen an der Schwerpunktposition und bei jedem Nachbarn. In diesem Fall ist die Kreuzkorrelation an der Schwerpunktposition der Durchschnitt von neun Kreuzkorrelationen: die Kreuzkorrelation des Schwerpunkt-Features mit sich selbst, die Kreuzkorrelation der Schwerpunktposition mit dem ersten Nachbarn, die Kreuzkorrelation der Schwerpunktposition mit dem zweiten Nachbarn usw. Bei jedem Vergleich wird die primäre Analysevariable der Schwerpunktposition mit der sekundären Variable des Nachbarn (oder mit sich selbst) verglichen. Durch Durchschnittsbildung der Korrelationen kann der Wert die Kreuzkorrelation des Bereichs besser widerspiegeln als die der einzelnen Position. Diese Durchschnittswertbildung wird für alle Zeitverzögerungen und alle Positionen wiederholt.

Kreuzkorrelation unter Verwendung von Nachbarn

Standardmäßig wird jede Korrelation im Durchschnitt gleich gewichtet. Wenn Sie jedoch ein Entfernungsband oder eine Nachbarschaft mit nächsten Nachbarn (K) verwenden, können Sie den Parameter Methode zur Gewichtung für räumliche Nachbarn verwenden, um Nachbarn, die näher an der Schwerpunktposition liegen, stärker zu gewichten. Sie können die Gewichtungen unter Verwendung eines Biquadrat- oder Gaußschen Kernels definieren.

Hinweis:

Bei Entfernungsband-Nachbarschaften ist die Bandbreite jedes Kernels gleich dem Entfernungsband. Unter Funktionsweise von "Kerndichte" finden Sie weitere Informationen zur Berechnung des Entfernungsbands. Bei nächsten Nachbarn (K) ist die Bandbreite gleich der Entfernung zum Nachbarn (k+1). Dadurch wird sichergestellt, dass alle k-Nachbarn näher als die Bandbreite liegen und eine Gewichtung ungleich Null haben. Bei Polygonpositionen werden die Entfernungen von Mittelpunkt-zu-Mittelpunkt verwendet, um Nachbarn und Gewichte zu bestimmen.

Filtern und Bereinigen von Trends

Bei einer gegebenen Zeitverzögerung misst die Kreuzkorrelation zwischen zwei Zeitserien, ob die beiden Zeitserien dazu neigen, gemeinsam zu steigen oder zu fallen. Dies kann als eine deskriptive Analyse betrachtet werden, die beschreibt und schätzt, wie stark sich die Werte entsprechen. Die direkte Kreuzkorrelation setzt sich jedoch aus verschiedenen Faktoren zusammen, darunter Trends, Saisonalität, Autokorrelation und die statistische Abhängigkeit der Variablen. Die unverarbeiteten Werte zweier Zeitserien können allein aufgrund gemeinsamer Trends und Autokorrelation stark korreliert sein. So sind beispielsweise die Verkäufe von Eiscreme und Sonnencreme stark korreliert, aber wenn man saisonale und wirtschaftliche Trends bereinigt, ist die Korrelation sehr gering. Sie können Trends, Saisonalität und Autokorrelation bereinigen (oft als Vorglättung und Filtern bezeichnet), indem Sie den Parameter Filtern und Entfernen von Trends aktivieren.

Insbesondere wenn es darum geht, die optimale Zeitverzögerung zwischen den Variablen zu schätzen, ist es wichtig, Trends zu filtern und zu bereinigen. Bei epidemiologischen Daten gibt es zum Beispiel eine Zeitverzögerung zwischen dem Anstieg der Krankheitszahlen und dem Anstieg der Hospitalisierungen. Werden jedoch die unverarbeiteten Werte der Zählungen verwendet, zeigt sich häufig keine Zeitverzögerung zwischen Krankheit und Hospitalisierung wegen starker Trends und Autokorrelation (d. h. die Zeitverzögerung Null weist die stärkste Korrelation auf). Wenn Trends bereinigt werden und die Autokorrelation herausgefiltert wird, zeigt die tatsächliche Zeitverzögerung zwischen Krankheit und Hospitalisierung (z. B. 10 Tage) häufig die stärkste Korrelation.

Da Trends, Saisonalität und Autokorrelation die Typ-1-Fehlerrate statistischer Tests erhöhen, werden p-Werte und 95 %-Konfidenzintervalle für die Kreuzkorrelationen nur berechnet, wenn Sie die Trends der beiden Zeitserien filtern und bereinigen. Außerdem können p-Werte und Konfidenzintervalle nur für paarweise Vergleiche von zwei Zeitserien berechnet werden. Das heißt, wenn Sie räumliche Nachbarn in die Berechnungen einbeziehen, werden keine p-Werte und Konfidenzintervalle für den gewichteten Durchschnitt der Kreuzkorrelationen berechnet. Sie können jedoch den Parameter Ausgabetabelle für paarweise Korrelationen verwenden, um eine Tabelle mit den p-Werten und Konfidenzintervallen zwischen jeder Position und einzelnen Nachbarn bei allen Zeitverzögerungen erstellen.

Hinweis:

Die p-Werte und Konfidenzintervalle werden unter der Annahme einer Normalverteilung der Kreuzkorrelation mit einer Standardabweichung gleich der Quadratwurzel aus der Anzahl der Zeitschritte berechnet. Dies ist ein asymptotisches Ergebnis, das für Zeitserien mit mindestens 30 Zeitschritten am genauesten ist. Bei kürzeren Zeitserien wird eine Warnung ausgegeben.

Die statistischen Signifikanztests werden unabhängig voneinander für jede Zeitverzögerung an jeder Position durchgeführt, und es gibt keine Korrektur für das Verfahren des Multiplen Testens (Multiple Hypothesis Testing). Bei der Interpretation der Signifikanz eines bestimmten p-Wertes oder Konfidenzintervalls ist Vorsicht geboten. Alle p-Werte werden anhand beidseitiger Hypothesentests berechnet.

Im Abschnitt Anpassen eines Modells zum Filtern und der Trendbereinigung weiter unten finden Sie Informationen über das Durchführen des Filterns und dem Bereinigen von Trends.

Werkzeugausgaben

Die primäre Ausgabe des Werkzeugs ist eine Feature-Class mit den Feldern der Ergebnisse der Kreuzkorrelation. In einer Karte wird die Feature-Class als Gruppen-Layer mit sechs Layern hinzugefügt, von denen jeder einen anderen Bereich der Ausgabe-Features darstellt. Jeder Layer verfügt über eine Option, mit der schnell zwischen den Layern gewechselt werden kann, ohne dass jeder Layer einzeln aktiviert und deaktiviert werden muss.

Drei der Layer zeigen Karten mit den stärksten Korrelationen: stärkste positive Korrelation, stärkste negative Korrelation und stärkste absolute Korrelation. Jede Position ist durch die größte positive Korrelation, die größte negative Korrelation oder die Korrelation mit dem größten absoluten Wert farblich gekennzeichnet.

Layer der stärksten absoluten Korrelation

Die letzten drei Layer zeigen die Zeitverzögerungen in Verbindung mit den drei Layern der stärksten Korrelation. Der Layer "Zeitverzögerung der stärksten absoluten Korrelation" zeigt beispielsweise die Zeitverzögerungen, die zu den stärksten absoluten Korrelationen geführt haben.

Layer der Zeitverzögerung der stärksten absoluten Korrelation

Durch die gemeinsame Verwendung dieser sechs Layer können Sie untersuchen, wie stark die primäre Analysevariable mit der sekundären Analysevariable an jeder Position korreliert, und ermitteln, welche Zeitverzögerungen zu diesen Korrelationen geführt haben. Möglicherweise stellen Sie in diesen Ergebnissen räumliche Muster fest, z. B. können einige Regionen kleinere Zeitverzögerungen oder stärkere Korrelationen aufweisen als andere. Sie stellen möglicherweise auch fest, dass ein und dieselbe Position abhängig von der Zeitverzögerung sowohl eine stark positive als auch eine stark negative Kreuzkorrelation aufweist. Beispielsweise können zwei Zeitserien einer zyklischen Raubtier-Beute-Beziehung positiv oder negativ korreliert werden, indem die Zyklen der beiden Zeitserien ineinander oder gegeneinander verschoben werden.

Zusätzlich zu den sechs Feldern, die im Gruppen-Layer verwendet werden, enthalten die Ausgabe-Features die folgenden Felder:

  • Felder für Objekt- und Positions-ID.
  • Kreuzkorrelationsfelder für jede Zeitverzögerung. Für jede Zeitverzögerung wird ein eigenes Feld erstellt.
  • Die Anzahl der Nachbarn der Position. Dieses Feld wird nur erstellt, wenn Sie räumliche Nachbarn in Berechnungen einbeziehen.

Wenn Sie Trends filtern und bereinigen und räumliche Nachbarn nicht in die Berechnungen einbeziehen, werden die folgenden Felder für jede der stärksten Korrelationen (positiv, negativ und absolut) erstellt:

  • Ein p-Wert-Feld zur Prüfung der statistischen Signifikanz der Kreuzkorrelation.
  • Felder der oberen und unteren Grenzen eines 95 %-Konfidenzintervalls für die Kreuzkorrelation.
  • Ein binäres Feld (0 oder 1), das angibt, ob die Kreuzkorrelation bei einem Konfidenzniveau von 95 % statistisch signifikant (Feldwert 1) oder nicht signifikant (Feldwert 0) ist.

Hinweis:

Wenn alle Kreuzkorrelationswerte an einer Position positiv sind, enthalten das Feld "Stärkste negative Korrelation" und das Feld "Verzögerung der stärksten negativen Korrelation" für diese Position den Wert Null. So führen auch alle negativen Korrelationen an einer Position zu Nullwerten in den Feldern mit der stärksten positiven Korrelation.

Der Eingabe-Raum-Zeit-Würfel wird mit den Ergebnissen der Analyse aktualisiert, und Sie können das Werkzeug Raum-Zeit-Würfel in 2D visualisieren mit der Anzeigedesignoption Ergebnisse der Zeitserien-Kreuzkorrelation verwenden, um die Ausgabe-Feature-Class und den Gruppen-Layer neu zu erstellen. Die Analysevariable mit den Ergebnissen der Kreuzkorrelation wird aus den Namen der primären und sekundären Analysevariablen mit einem Unterstrich dazwischen gebildet. Wenn zum Beispiel die Eingabevariablen den Namen MARKETING und SALES haben, erhält die Analysevariable mit den Ergebnissen den Namen MARKETING_SALES.

Pop-up-Diagramme

Sie können interaktive Pop-up-Diagramme für die Ausgabe-Features erstellen, indem Sie den Parameter Zeitserien-Pop-ups aktivieren aktivieren. Wird ein Feature erstellt, können Sie mit dem Werkzeug Erkunden auf das Feature klicken und ein Balkendiagramm der Kreuzkorrelationen für jede Zeitverzögerung sowie ein Liniendiagramm mit den primären und sekundären Analysevariablen anzeigen.

Pop-up-Diagramm zur Zeitverzögerung der Korrelation

Wenn Sie mit der Maus auf einen der Balken im Balkendiagramm zeigen, verschiebt sich die Zeitserie darunter um die entsprechende Zeitverzögerung. So können Sie sehen, wie sich die beiden Zeitserien nach verschiedenen Zeitverzögerungen ausrichten.

Balkendiagramm mit animierter Zeitserie

Wenn Sie Trends filtern und bereinigen und räumliche Nachbarn nicht einbeziehen, zeigt das Pop-up-Diagramm 95 %-Konfidenzintervalle (hellblau schattiert) um die Kreuzkorrelationen jeder Zeitverzögerung an. Mit dem Kontrollkästchen Trendbereinigte und gefilterte Zeitserien anzeigen legen Sie fest, ob die unverarbeiteten Werte der Zeitserien oder die Zeitserien nach dem Filtern und der Bereinigen von Trends angezeigt werden.

Pop-up-Diagramm zur Zeitverzögerung der Korrelation mit Konfidenzintervallen und gefilterten Zeitserien

Hinweis:

Wenn Sie die räumlichen Nachbarn in die Berechnungen einbeziehen, wird nur das Balkendiagramm mit der Zeitverzögerung angezeigt. Damit soll verhindert werden, dass zu viele Zeitserien in jedes Pop-up-Diagramm eingefügt werden.

Wenn die Ausgabe-Features als Shapefile (.shp) gespeichert werden, werden keine Pop-up-Diagramme erstellt.

Ausgabe-Korrelationstabellen

Um die Ergebnisse der Kreuzkorrelation als Tabelle zu speichern, verwenden Sie den Parameter Ausgabetabelle für verzögerte Korrelationen. In der Tabelle enthält jede Zeile die Kreuzkorrelation für eine einzelne Position und eine einzelne Zeitverzögerung. Die Anzahl der Zeilen in der Tabelle ist gleich der Anzahl der Positionen multipliziert mit der Anzahl der Zeitverzögerungen. Wenn Sie außerdem Trends filtern und bereinigen und räumliche Nachbarn nicht in die Berechnungen einbeziehen, enthält die Tabelle Felder mit dem p-Wert und den oberen und unteren Grenzen eines 95 %-Konfidenzintervalls. Das zeilenweise Speichern der Informationen als Tabelle (und nicht als Felder der ausgegebenen Features) ist für den Export und die Analyse der Kreuzkorrelationsergebnisse oft vorteilhafter. Die Tabelle kann für weitere Analysen auch mit den Positionen verbunden werden.

Wenn Sie räumliche Nachbarn in die Berechnungen einbeziehen, können Sie auch den Parameter Ausgabetabelle für paarweise Korrelationen verwenden, um eine Tabelle zu erstellen, die Vergleiche zwischen jeder Schwerpunktposition und einzelnen Nachbarn für jede Zeitverzögerung enthält. Wenn zum Beispiel 10 Positionen, 5 Zeitverzögerungen und 7 Nachbarn pro Position vorhanden sind, gibt es 10*5*(7+1)=400 Zeilen in der Ausgabetabelle (die 1 wird hinzugefügt, um die Vergleiche der Schwerpunktposition mit sich selbst zu berücksichtigen). Für jede Kombination wird die zugehörige Kreuzkorrelation als ein Feld gespeichert. Wenn Sie Trends filtern und bereinigen, enthält die Tabelle ebenfalls Felder mit dem p-Wert und den oberen und unteren Grenzen eines 95 %-Konfidenzintervalls.

Geoverarbeitungsmeldungen

Das Werkzeug gibt eine Reihe von Meldungen aus, die Informationen zu den Ergebnissen des Werkzeugs enthalten. Die Meldungen bestehen aus zwei Abschnitten.

Im Abschnitt Details des Eingabe-Raum-Zeit-Würfels werden die Eigenschaften des Eingabe-Raum-Zeit-Würfels zusammen mit Informationen über das Zeitschrittintervall sowie der Anzahl der Zeitschritte, Positionen und Raum-Zeit-Abschnitte angezeigt. Welche Eigenschaften im ersten Abschnitt angezeigt werden, hängt von der Erstellung des Würfels ab, weshalb die Informationen von Würfel zu Würfel variieren.

Der Abschnitt Zusammenfassung der Korrelationen nach Zeitverzögerung zeigt eine Tabelle mit Summenstatistiken der Kreuzkorrelationen über alle Positionen für jede Zeitverzögerung. Die Tabelle zeigt für jede Zeitverzögerung das Minimum, das Maximum, den Durchschnitt, die Standardabweichung und die Anzahl der Kreuzkorrelationen aller Positionen an. Wenn Sie Trends filtern und bereinigen und räumliche Nachbarn nicht einbeziehen, enthält die Tabelle auch eine Anzahl von Positionen mit statistisch signifikanten Kreuzkorrelationen für jede Zeitverzögerung. Anhand dieser Summenstatistiken können Sie schnell einzelne Zeitverzögerungen identifizieren, die über viele Positionen hinweg stark korreliert sind, und so möglicherweise Muster erkennen, die bei der Untersuchung der Ergebnisse einzelner Positionen nicht auffallen würden.

Diagramme

Die drei Layer, die die Zeitverzögerungen der stärksten Korrelationen (positiv, negativ und absolut) anzeigen, enthalten jeweils ein Balkendiagramm, das die Anzahl der Positionen anzeigt, die die stärkste Korrelation für jede Zeitverzögerung aufweisen. In der nachstehenden Abbildung wurde beispielsweise an den meisten Positionen die stärkste absolute Korrelation mit einer Zeitverzögerung von 0 erreicht. Dies bedeutet, dass es an den meisten Positionen keine geschätzte Verzögerung zwischen den beiden Zeitserien gibt.

Balkendiagramm der Anzahl der Positionen mit der stärksten Korrelation nach Zeitverzögerung

Formel für die Kreuzkorrelation

Für eine gegebene Zeitverzögerung lautet die Formel für die Kreuzkorrelation zwischen zwei Zeitserien wie folgt:

Formel für die Kreuzkorrelation
  • k ist die Zeitverzögerung.
  • t ist der Zeitschritt.
  • T ist die Anzahl der Zeitschritte in jeder Zeitserie.
  • X(t) ist der Wert der primären Analysevariablen im Zeitschritt t.
  • Y(t) ist der Wert der sekundären Analysevariablen im Zeitschritt t.
  • ist der Durchschnitt der primären Analysevariablen (unter Verwendung aller Zeitschritte).
  • Ȳ ist der Durchschnitt der sekundären Analysevariablen (unter Verwendung aller Zeitschritte).

Zähler und Nenner werden durch die Anzahl der Terme in den Summen geteilt, um eine Verzerrung bei größeren Zeitverzögerungen zu korrigieren.

Anpassen eines Modells zum Filtern und der Trendbereinigung

Wenn Sie die Zeitserie filtern und Trends bereinigen, werden vor dem Anwenden der Zeitverzögerung und der Berechnung von Kreuzkorrelationen die folgenden Vorverarbeitungsschritte für die primären und sekundären Analysevariablen durchgeführt:

  1. Ein OLS-Regressionsmodell (Kleinste Quadrate (Ordinary Least Squares)) wird erstellt, um den nächsten Wert der primären Analysevariablen aus dem vorhergehenden Wert vorherzusagen. In dem Modell wird jeder Zeitschritt als beschreibende Variable verwendet, um den Wert des nächsten Zeitschritts vorherzusagen.
  2. Es wird ein zweites OLS-Modell erstellt, das den nächsten Wert der primären Analysevariablen anhand der beiden vorherigen Werte vorhersagt. So werden beispielsweise die ersten beiden Zeitschritte für die Vorhersage des dritten Zeitschritts verwendet; der zweite und dritte Zeitschritt werden für die Vorhersage des vierten Zeitschritts verwendet, usw.
  3. Es werden drei weitere OLS-Modelle erstellt, die drei, vier bzw. fünf vorherige Werte verwenden, um den nächsten Wert der primären Analysevariablen vorherzusagen.
  4. Es wird eine schnelle Fourier-Transformation (FFT, Fast Fourier Transform) zum Schätzen der Saisonalität der primären Variable verwendet. Ein sechstes OLS-Modell verwendet diese Anzahl von Zeitschritten, um den nächsten Wert vorherzusagen.
  5. Die AICc-Werte werden für jedes der sechs OLS-Modelle berechnet, und das Modell mit dem niedrigsten Wert wird als Modell für das Filtern und Bereinigen von Trends ausgewählt.
  6. Anhand der Koeffizienten des gewählten Modells werden die Residuen für die primäre Analysevariable berechnet. Diese Residuen werden zur neuen primären Variable. Dieser Schritt wird oft als Vorglättung der primären Variablen bezeichnet, da die Residuen ein zufälliges weißes Rauschen anzeigen sollen.
  7. Die Residuen werden für die sekundäre Analysevariable berechnet, indem die Koeffizienten auf die Werte der sekundären Variable angewandt werden. Diese Residuen werden zur neuen sekundären Variable. Dieser Schritt wird oft als das Filtern der sekundären Variablen bezeichnet. Da die Koeffizienten anhand der primären Variablen geschätzt wurden, ist davon auszugehen, dass die Residuen der sekundären Variablen immer noch einige Trends und Autokorrelation enthalten (und kein zufälliges weißes Rauschen).
  8. Dieser Prozess wird für jede Position unabhängig voneinander wiederholt. Wenn räumliche Nachbarn verwendet werden, wird der Prozess für die primäre Variable der Schwerpunktposition und die sekundäre Variable jedes Nachbarn (und sich selbst) durchgeführt.

Hinweis:

Durch das Filtern und Bereinigen von Trends wird die Länge der einzelnen Zeitserien um die Anzahl der Zeitschritte verringert, die als beschreibende Variablen in dem in Schritt 5 gewählten OLS-Modell verwendet werden. Wenn beispielsweise drei Zeitschritte zur Vorhersage des nächsten Wertes verwendet werden, können die Residuen nicht für die ersten drei Zeitschritte jeder Zeitserie berechnet werden.

Referenzen

Brockwell, P. J. und Davis, R. A. (2002). Introduction to Time Series and Forecasting. New York, NY: Springer New York. https://doi.org/10.1007/978-3-319-29854-2.

Chan, K.S. und Cryer, J.D. (2008). Time Series Analysis With Applications in R. New York, NY: Springer New York. https://doi.org/10.1007/978-0-387-75959-3.

Verwandte Themen