Grundlegende Begriffe für Geostatistical Analyst

Mit der Geostatistical Analyst-Lizenz verfügbar.

Die folgenden Begriffe und Konzepte tauchen immer wieder im Zusammenhang mit der Geostatistik und innerhalb von Geostatistical Analyst auf.

BegriffBeschreibung

Kreuzvalidierung

Eine Technik zur Bewertung der Genauigkeit eines Interpolationsmodells. Bei der Kreuzvalidierung in Geostatistical Analyst wird ein Punkt ausgelassen und der Rest zur Vorhersage eines Wertes an der betreffenden Position verwendet. Anschließend wird der Punkt dem Dataset wieder hinzugefügt, und ein anderer Punkt entfernt. Dieser Vorgang wird für alle Stichproben im Dataset wiederholt, sodass Paare von vorhergesagten und bekannten Werten bereitgestellt werden, die verglichen werden können, um die Modell-Performance zu bewerten. Die Ergebnisse werden in der Regel als Mean Error und Root Mean Squared Error zusammengefasst.

Deterministische Methoden

Methoden, die basierend auf dem Ausmaß der Ähnlichkeit (z. B. IDW-Interpolation) oder dem Grad der Glättung (z. B. radiale Basisfunktionen) Oberflächen aus gemessenen Punkten erstellen, werden in Geostatistical Analyst als deterministische Methoden bezeichnet. Sie berücksichtigen keine Unsicherheitsfaktoren (Fehler) der Vorhersagen.

Geostatistischer Layer

Die von vielen Geoverarbeitungswerkzeugen in der Toolbox "Geostatistical Analyst" erstellten Ergebnisse werden auf einer Oberfläche gespeichert, die als "geostatistischer Layer" bezeichnet wird. Geostatistische Layer können zum Erstellen von Ergebniskarten, zum Anzeigen und Überarbeiten der Parameterwerte der Interpolationsmethode, zum Erstellen anderer Typen von geostatistischen Layern (z. B. Karten mit Vorhersagefehlern) sowie zum Exportieren der Ergebnisse in Raster- oder Vektorformate (Konturlinien, gefüllte Konturlinien und Punkte) verwendet werden.

Geostatistische Methoden

Methoden, die auf statistischen Modellen basieren, die Autokorrelation (statistische Beziehungen zwischen den gemessenen Punkten) enthalten, werden in Geostatistical Analyst als geostatistische Methoden bezeichnet. Diese Methoden können vorhergesagte Oberflächen unter Berücksichtigung von Unsicherheitsfaktoren (Fehlern), die mit diesen Vorhersagen verbunden ist, erzeugen.

Interpolation

Ein Verfahren, bei dem an bekannten Stichprobenpositionen Messwerte erfasst werden, um Werte für nicht beprobte Positionen vorherzusagen (zu schätzen). Geostatistical Analyst stellt mehrere Interpolationsmethoden bereit, die sich durch die ihnen zugrunde liegenden Annahmen, die Datenanforderungen und die Funktionen zum Erstellen verschiedener Ausgabetypen (z. B. vorhergesagte Werte und die mit ihnen verbundenen Fehler [Unsicherheiten]) unterscheiden.

Kernel

Eine Gewichtungsfunktion, die in mehreren in Geostatistical Analyst verfügbaren Interpolationsmethoden verwendet wird. In der Regel werden Stichprobenwerten, die sich in der Nähe der Vorhersageposition befinden, höhere Gewichtungen und weiter entfernten Stichprobenwerten niedrigere Gewichtungen zugewiesen.

Kriging

Eine Sammlung von Interpolationsmethoden, die Semivariogramm-Modelle der räumlichen Autokorrelation verwenden, um vorhergesagte Werte, mit den Vorhersagen verbundene Fehler und andere Informationen zur Verteilung möglicher Werte für jede Position im Untersuchungsgebiet zu erstellen (mittels Quantil- und Wahrscheinlichkeitskarten oder durch geostatistische Simulation, die einen Satz möglicher Werte für jede Position liefert).

Search neighborhood

Die meisten Interpolationsmethoden verwenden für Vorhersagen eine lokale Teilmenge der Daten. Stellen Sie sich ein bewegliches Fenster vor. Um eine Vorhersage für den Mittelpunkt des Fensters zu treffen, werden nur Daten verwendet, die sich innerhalb des Fensters befinden. Der Grund hierfür ist, dass Stichproben, die weit von der Position entfernt sind, für die wir eine Vorhersage treffen müssen, redundante Informationen enthalten, und wir durch Verwendung der Suchnachbarschaft die Rechenzeit zum Generieren des vorhergesagten Wertes für das gesamte Untersuchungsgebiet verkürzen können. Die Auswahl der Nachbarschaft (Anzahl der Stichproben in der Nähe und ihre räumliche Konfiguration innerhalb des Fensters) sollte mit Bedacht erfolgen, da sie sich auf die vorhergesagte Oberfläche auswirkt.

Semivariogramm

Eine Funktion, die die Unterschiede (Varianz) zwischen Stichproben beschreibt, die durch unterschiedliche Entfernungen voneinander getrennt sind. In der Regel zeigt das Semivariogramm eine niedrige Varianz für kleine Unterschiede und größere Varianzen bei größeren Entfernungen an, was bedeutet, dass die Daten räumlich autokorreliert sind. Anhand von Stichprobendaten geschätzte Semivariogramme werden als empirische Semivariogramme bezeichnet. Sie werden als eine Gruppe von Punkten in einem Diagramm dargestellt. An diese Punkte wird eine Funktion, das sogenannte Semivariogramm-Modell, angepasst. Das Semivariogramm-Modell ist eine wichtige Komponente von Kriging-Methoden (leistungsstarken Interpolationsmethoden, die vorhergesagte Werte, mit den Vorhersagen verbundene Fehler und Informationen zur Verteilung möglicher Werte für jede Position im Untersuchungsgebiet liefern können.)

Simulation

In der Geostatistik wird hiermit eine Technik bezeichnet, die das Kriging-Verfahren erweitert, indem viele mögliche Versionen einer vorhergesagten Oberfläche erstellt werden (beim Kriging-Verfahren wird nur eine Oberfläche erstellt). Die vorhergesagten Oberflächen liefern eine Fülle an Informationen. Diese können zur Beschreibung der Unsicherheit eines vorhergesagten Wertes für eine bestimmte Position, zur Beschreibung der Unsicherheit für mehrere vorhergesagte Werte in einem Interessenbereich oder zur Beschreibung einer Gruppe von vorhergesagten Werten, die als Eingabe für ein zweites Modell verwendet werden können (z. B. physisch, wirtschaftlich), genutzt werden, um Risiken zu bewerten und fundiertere Entscheidungen zu treffen.

Räumliche Autokorrelation

Räumliche Autokorrelation findet sich häufig bei Naturphänomenen – Stichprobenwerte, die nahe beieinander erfasst werden, sind sich ähnlicher als Stichprobenwerte, die weit entfernt voneinander erfasst werden. Einige Interpolationsmethoden erfordern ein explizites Modell der räumlichen Autokorrelation (z. B. Kriging-Methoden), andere verlassen sich auf ein angenommenes Ausmaß der räumlichen Autokorrelation, ohne eine Möglichkeit zu deren Messung bereitzustellen (z. B. IDW-Interpolation), und nochmal andere erfordern überhaupt kein Konzept der räumlichen Autokorrelation im Dataset. Beachten Sie, dass beim Vorhandensein von räumlicher Autokorrelation herkömmliche statistische Methoden (die sich auf die Unabhängigkeit der einzelnen Beobachtungen verlassen) nicht zuverlässig verwendet werden können.

Transformation

Eine Datentransformation wird durchgeführt, wenn eine Funktion (Logarithmus-, Box-Cox-, Arkussinus-, Z-Funktion) auf die Daten angewendet wird, um die Form ihrer Verteilung zu ändern und/oder die Varianz zu stabilisieren (also die Beziehung zwischen dem Mittelwert und der Varianz zu verringern, z. B. wenn die Datenvariabilität mit größer werdendem Mittelwert zunimmt).

Validierung

Vergleichbar mit der Kreuzvalidierung, aber anstatt dasselbe Dataset zum Erstellen und Evaluieren des Modells zu verwenden, werden zwei Datasets verwendet – eines zum Erstellen des Modells und das andere zum Durchführen eines unabhängigen Performance-Tests. Wenn nur ein Dataset verfügbar ist, kann das Werkzeug "Teilmengen aus Features erstellen" verwendet werden, um eine Unterteilung in Training- und Test-Teilmengen nach dem Zufallsprinzip vorzunehmen.

Grundlegende Begriffe für Geostatistical Analyst