Was sind die verschiedenen Kriging-Modelle?

Mit der Geostatistical Analyst-Lizenz verfügbar.

Kriging-Methoden basieren auf mathematischen und statistischen Modellen. Von den deterministischen Methoden, die in Deterministische Methoden für die räumliche Interpolation beschrieben werden, unterscheiden sich die Kriging-Methoden durch ein statistisches Modell, das Wahrscheinlichkeiten enthält. Beim Kriging wird den Vorhersagen eine gewisse Wahrscheinlichkeit zugeschrieben, d. h. die Werte sind nicht perfekt aus einem statistischen Modell vorhersagbar. Nehmen wir als Beispiel die durch eine Stichprobe ermittelten Stickstoffwerte eines Feldes. Es ist klar, dass es selbst bei einer umfangreichen Stichprobe nicht möglich sein wird, den genauen Stickstoffwert an einem Ort vorherzusagen, an dem keine Messung stattgefunden hat. Deshalb wird nicht nur eine Vorhersage erstellt, sondern auch versucht, die Fehlerrate der Vorhersage zu ermitteln.

Alle Kriging-Methoden basieren auf Autokorrelation. Unter Korrelation versteht man in der Regel die Tendenz, dass zwei Arten von Variablen miteinander in Beziehung stehen. Zum Beispiel neigt der Aktienmarkt dazu, sich bei niedrigeren Zinsen positiv zu entwickeln, sodass sich sagen lässt, dass diese zwei Variablen negativ miteinander korreliert sind. Der Aktienmarkt ist jedoch positiv autokorreliert, d. h. er weist eine Korrelation in sich selbst auf. Am Aktienmarkt sind zwei Werte tendenziell ähnlicher, wenn sie nur einen Tag auseinander liegen, als wenn sie ein Jahr auseinander liegen. Dies hängt mit einem grundlegenden geografischen Prinzip zusammen: Dinge, die näher beieinander liegen, sind sich tendenziell ähnlicher als solche, die weiter voneinander entfernt sind. Der Grad, um den die Korrelation abnimmt, kann als Entfernungsfunktion ausgedrückt werden.

Die Autokorrelation ist eine Entfernungsfunktion. Dies ist ein wesentliches Merkmal der Geostatistik. In der klassischen Statistik wird davon ausgegangen, dass Beobachtungen unabhängig sind, d. h., dass es keine Korrelation zwischen Beobachtungen gibt. In der Geostatistik ermöglichen die Informationen über räumliche Positionen die Berechnung von Entfernungen zwischen Beobachtungen und die Modellierung der Autokorrelation als Entfernungsfunktion.

Beachten Sie auch, dass der Aktienmarkt im Allgemeinen mit der Zeit steigt, was als Trend bezeichnet wird. Für geostatistische Daten gelten die gleichen Begriffe und Terme, die in der folgenden einfachen mathematischen Formel ausgedrückt werden:

Z(s) = µ(s) + ε(s)

wobei Z(s) die Variable von Interesse ist, die in einen deterministischen Trend µ(s) und eine zufällige, autokorrelierte Fehlerform ε(s) zerlegt wird. Das Symbol s gibt einfach den Ort an; es enthält quasi die räumlichen X-Koordinaten (Längengrad) und Y-Koordinaten (Breitengrad). Variationen dieser Formel bilden die Grundlage für die verschiedenen Arten von Kriging. Beginnen Sie auf der rechten Seite und gehen Sie nach links.

Unabhängig davon, wie kompliziert der Trend im Modell ist, liefert µ(s) keine perfekte Vorhersage. In diesem Fall werden einige Annahmen über den Fehlerterm ε(s) gemacht: Es wird erwartet, dass er (im Durchschnitt) 0 ist und dass die Autokorrelation zwischen ε(s) und ε(s + h) nicht vom tatsächlichen Ort s, sondern nur vom Versatz h zwischen den beiden abhängt. Dies ist für die Replikation notwendig, damit Sie die Autokorrelationsfunktion schätzen können. Sehen Sie sich z. B. folgende Abbildung an:

Autokorrelationspfeile

Es wird angenommen, dass die Zufallsfehler von Ortspaaren, die durch die Pfeile verbunden sind, dieselbe Autokorrelation aufweisen.

Sehen Sie sich als Nächstes den Trend an. Er kann eine einfache Konstante sein, d. h. µ(s) = m für alle Orte s; und wenn µ unbekannt ist, ist dies das Modell, auf dem das Ordinary Kriging basiert. Er kann auch aus einer linearen Funktion der räumlichen Koordinaten selbst bestehen, z. B.:

µ(s) = ß0 + ß1x + ß2y + ß3x2 + ß4y2 + ß5xy,

wobei es sich um eine polynomische Trendoberfläche zweiten Grades und lediglich eine lineare Regression für die räumlichen X- und Y-Koordinaten handelt. Variierende Trends und Trends, bei denen die Regressionskoeffizienten unbekannt sind, bilden Modelle für das Universal Kriging. Wenn der Trend vollständig bekannt ist (d. h. alle Parameter und Kovariablen bekannt sind), ob konstant oder nicht, bildet er ein Modell für das Simple Kriging.

Betrachten wir nun die linke Seite der Zerlegung: Z(s) = µ(s) + ε(s). Sie können Transformationen für Z(s) durchführen. Sie können es z. B. in eine Indikatorvariable umwandeln, bei der sie 0 ist, wenn Z(s) unter einem bestimmten Wert liegt (z. B. 0,12 ppm für die Ozonkonzentration), oder 1 ist, wenn sie über einem bestimmten Wert liegt. Sie möchten z. B. die Wahrscheinlichkeit vorhersagen, mit der Z(s) über dem Schwellenwert liegt, und die Vorhersagen auf der Grundlage dieses Modells bilden das Indicator Kriging. Sie können allgemeine, nicht spezifizierte Transformationen von Z(s) vornehmen und sie fi(Z(si)) für die i. Variable nennen. Sie können Einflussfaktoren für Funktionsvariablen bilden; wenn Sie beispielsweise eine Vorhersage für den Ort s0 treffen wollen, bilden Sie den Einflussfaktor für Disjunctive Kriging g(Z(s0)) unter Verwendung der Daten fi(Z(si)).

Betrachten Sie schließlich den Fall, dass Sie mehr als einen Variablentyp haben und Sie die Modelle Zj(s) = µj(s) + εj(s) für den j.ten Variablentyp bilden. Hier können Sie für jede Variable einen anderen Trend berücksichtigen, und neben der Autokorrelation für die Fehler εj(s) gibt es auch eine Kreuzkorrelation zwischen den Fehlern εj(s) und εk(s) für die beiden Variablentypen. Sie können zum Beispiel die Kreuzkorrelation zwischen zwei Variablen wie der Ozonkonzentration und der Feinstaubbelastung betrachten, wobei diese nicht an denselben Orten gemessen werden müssen. Modelle, die auf mehr als einer Variable von Interesse basieren, bilden die Grundlage von CoKriging. Sie können eine Indikatorvariable von Z(s) bilden, und wenn Sie sie unter Verwendung der ursprünglichen, nicht transformierten Daten Z(s) in einem CoKriging-Modell vorhersagen, erhalten Sie Probability Kriging. Wenn Sie mehr als eine Variable von Interesse haben, können Sie die Verwendung von Ordinary CoKriging, Universal CoKriging, Simple CoKriging, Indicator CoKriging, Probability CoKriging und Disjunctive CoKriging als multivariate Erweiterungen der zuvor beschriebenen verschiedenen Arten von Kriging in Betracht ziehen.