Entfernen von Trends aus den Daten

Mit der Geostatistical Analyst-Lizenz verfügbar.

Möglicherweise möchten Sie einen Oberflächentrend aus Ihren Daten entfernen und Kriging oder CoKriging für die trendbereinigten Daten (Residuen) verwenden. Sie können das Additionsmodell verwenden:

Z(s) = µ(s) + ε(s)

Dabei ist µ(s) eine deterministische Oberfläche (der Trend), und ε(s) ist ein räumlich autokorrelierter Fehler.

Konzeptionell gesehen ist der Trend fest, das heißt, wenn Sie wiederholt Daten simulieren, ändert er sich nie. Auf den simulierten Oberflächen ergeben sich jedoch aufgrund der autokorrelierten Zufallsfehler Fluktuationen. Normalerweise ändert sich der Trend im Verlauf der Oberfläche allmählich, während sich die Zufallsfehler schneller ändern. Ein meteorologisches Beispiel für einen Trend wäre es, wenn Sie ein Temperaturgefälle in Verbindung mit einem Breitengrad beobachten (und es theoretisch kennen). Die Beobachtungen an einem bestimmten Tag ergeben jedoch lokale Variationen aufgrund von Wetterfronten, Bodenbedeckung, Wolkenmustern usw., die nicht so vorhersehbar sind. Daher werden die lokalen Variationen als autokorreliert modelliert.

Leider gibt es keine Möglichkeit, wie durch Zauberei Daten eindeutig in einen Trend und in Zufallsfehler zu zerlegen. Das folgende Beispiel ist als nützlicher Leitfaden gedacht.

Die Daten im folgenden Trendbereinigungsdiagramm wurden anhand von zwei Modellen simuliert. Das eine Modell war das Kriging-Modell mit der Option "Ordinary", für das Z(s) = µ + ε(s) gilt und die Fehler autokorreliert wurden. Der Prozess hatte den Mittelwert µ = 0 mit einem exponentiellen Semivariogramm. Ein anderes Dataset wurde anhand eines Kriging-Modells mit der Option "Universal" mit µ(s) = ß0 + ß1x(s) + ß2x2(s), an der durchgezogenen Linie zu erkennen, simuliert, aber die Fehler traten unabhängig auf mit dem Mittelwert 0 und der Varianz 1.

Trendbereinigungsdiagramm

Die beiden Datasets sind schwer zu unterscheiden (die blauen Kreise gehören zum Kriging-Modell "Ordinary" und die roten Kreise zum Kriging-Modell "Universal" mit unabhängigen Fehlern). Bei räumlicher Autokorrelation sind flexible Vorhersageoberflächen möglich, und dieses Beispiel zeigt, dass es schwierig sein kann, sich allein basierend auf den Daten für eines der Modelle zu entscheiden. Im Allgemeinen sollten Sie beim Kriging mit der Option "Ordinary" bleiben, es sei denn, Sie haben wichtige Gründe, eine Trendoberfläche zu entfernen. Der Grund ist, dass es am besten ist, Ihre Modelle so einfach wie möglich zu halten. Wenn Sie eine Trendoberfläche entfernen, müssen mehr Parameter geschätzt werden. Bei einer zweidimensionalen quadratischen Oberfläche kommen zusätzlich zum Schnittpunktparameter fünf Parameter hinzu, die geschätzt werden müssen. Je mehr Parameter geschätzt werden, umso mehr nimmt die Genauigkeit der Modelle ab.

Es kann jedoch Fälle geben, in denen die räumlichen Koordinaten als Proxy für einen bekannten Trend in den Daten dienen. So kann sich zum Beispiel die Getreideproduktion mit dem Breitengrad ändern, und zwar nicht aufgrund der Koordinaten selbst, sondern weil sich Temperatur, Feuchtigkeit, Niederschläge usw. mit dem Breitengrad ändern. In diesen Fällen kann es sinnvoll sein, Trendoberflächen zu entfernen. Wie bereits erwähnt, sollten die Oberflächen so einfach wie möglich sein, beispielsweise Polynome erster oder zweiter Ordnung.

Wenn Sie Trends verwenden und die Residuen zu wenig Variation aufweisen, besteht die Gefahr einer Überanpassung der Daten, um die Unsicherheit der Vorhersage angemessen zu berücksichtigen. Achten Sie bei Verwendung von Trendmodellen immer darauf, die Modelle mit Kreuzvalidierung und insbesondere Validierung zu überprüfen.

Weitere Informationen zu Transformationen und Trends