Kreuzvalidierung (Geostatistical Analyst)

Mit der Geostatistical Analyst-Lizenz verfügbar.

Zusammenfassung

Entfernt eine Datenposition und sagt die zugehörigen Daten anhand der Daten an den übrigen Positionen vorher. Dieses Werkzeug dient in erster Linie dazu, den vorhergesagten Wert mit dem beobachteten Wert zu vergleichen, um nützliche Informationen über einige Ihrer Modellparameter zu erhalten.

Weitere Informationen zu Kreuzvalidierungen und Validierungen

Verwendung

  • Wenn Sie dieses Werkzeug in Python verwenden, enthält das Objekt result sowohl eine Feature-Class als auch eine Klasse CrossValidationResult mit folgenden Eigenschaften:

    • Anzahl: Gesamtzahl der verwendeten Stichproben.
    • Mean Error: Die gemittelte Differenz zwischen den gemessenen und den vorhergesagten Werten.
      Mean Error
    • Root Mean Square Error: Gibt an, wie gut Ihr Modell die gemessenen Werte vorhersagt. Je kleiner dieser Fehler, desto besser das Modell.
      Root Mean Square Error
    • Average Standard Error: Der Durchschnitt der Standardfehler der Vorhersage.
      Average Standard Error
    • Mean Standardized Error: Der Durchschnitt der standardisierten Fehler. Dieser Wert sollte nahe 0 sein.
      Mean Standardized Error
    • Root Mean Square Standardized Error. Dieser Wert sollte nahe 1 sein, wenn die Standardfehler der Vorhersage gültig sind. Liegt der Wert für den Root Mean Square Standardized Error über 1, haben Sie die Variabilität der Vorhersagen zu gering eingeschätzt. Liegt der Wert für den Root Mean Square Standardized Error unter 1, haben Sie die Variabilität der Vorhersagen zu hoch eingeschätzt.
      Root Mean Square Standardized Error
    • Prozent im 90-%-Intervall: Der Prozentsatz der Punkte, die in einem 90-prozentigen Konfidenzintervall der Kreuzvalidierung liegen. Dieser Wert sollte ungefähr 90 betragen.
    • Prozent im 95-%-Intervall: Der Prozentsatz der Punkte, die in einem 95-prozentigen Konfidenzintervall der Kreuzvalidierung liegen. Dieser Wert sollte ungefähr 95 betragen.
    • Average CRPS: Der durchschnittliche Continuous Ranked Probability Score (CRPS) aller Punkte. Der CRPS ist ein Diagnoseinstrument, das die Abweichung von der prädiktiven kumulativen Verteilungsfunktion zu jedem beobachteten Datenwert misst. Dieser Wert sollte so klein wie möglich sein. Dieses Diagnoseinstrument hat Vorteile gegenüber anderen Diagnoseinstrumenten für Kreuzvalidierungen, da es die Daten mit einer vollständigen Verteilung anstatt mit Einzelpunktvorhersagen vergleicht. Die Berechnung dieser Statistik beinhaltet Simulationen und kann daher nicht in einer einfachen Formel ausgedrückt werden.

    Für IDW, Globale Polynominterpolation, Radiale Basisfunktionen, Diffusionsinterpolation mit Barrieren und Kernelinterpolation mit Barrieren sind nur die Ergebnisse "Mean Error" und "Root Mean Square Error" verfügbar.

    "Prozent im 90-%-Intervall", "Prozent im 95-%-Intervall" und "Average CRPS" sind nur für die Modelle Empirical Bayesian Kriging und Regressionsvorhersage mit EBK verfügbar.

  • Die Felder in der optionalen Ausgabe-Feature-Class sind im Werkzeug GA-Layer in Punkte beschrieben.

Parameter

BeschriftungErläuterungDatentyp
Geostatistischer Eingabe-Layer

Der geostatistische Layer, der analysiert werden soll.

Geostatistical Layer
Ausgabe-Point-Feature-Class
(optional)

Speichert die Statistiken zur Kreuzvalidierung an jeder Position im geostatistischen Layer.

Feature Class

Abgeleitete Ausgabe

BeschriftungErläuterungDatentyp
Anzahl

Gesamtzahl der verwendeten Stichproben.

Long
Mean Error

Mean Error: Die gemittelte Differenz zwischen den gemessenen und den vorhergesagten Werten.

Double
Root Mean Square

Root Mean Square Error: Gibt an, wie gut Ihr Modell die gemessenen Werte vorhersagt.

Double
Average Standard

Average Standard Error: Der Durchschnitt der Standardfehler der Vorhersage.

Double
Mean Standardized

Mean Standardized Error: Der Durchschnitt der standardisierten Fehler.

Double
Root Mean Square Standardized

Root Mean Square Standardized Error. Dieser Wert sollte nahe 1 sein, wenn die Standardfehler der Vorhersage gültig sind.

Double
Prozent im 90-%-Intervall

Prozent im 90-%-Intervall: Der Prozentsatz der Punkte, die in einem 90-prozentigen Konfidenzintervall der Kreuzvalidierung liegen. Dieser Wert sollte ungefähr 90 betragen.

Double
Prozent im 95-%-Intervall

Prozent im 95-%-Intervall: Der Prozentsatz der Punkte, die in einem 95-prozentigen Konfidenzintervall der Kreuzvalidierung liegen. Dieser Wert sollte ungefähr 95 betragen.

Double
Average CRPS

Average CRPS: Der durchschnittliche Continuous Ranked Probability Score (CRPS) aller Punkte. Der CRPS ist ein Diagnoseinstrument, das die Abweichung von der prädiktiven kumulativen Verteilungsfunktion zu jedem beobachteten Datenwert misst. Dieser Wert sollte so klein wie möglich sein. Dieses Diagnoseinstrument hat Vorteile gegenüber anderen Diagnoseinstrumenten für Kreuzvalidierungen, da es die Daten mit einer vollständigen Verteilung anstatt mit Einzelpunktvorhersagen vergleicht. Die Berechnung dieser Statistik beinhaltet Simulationen und kann daher nicht in einer einfachen Formel ausgedrückt werden.

Double

arcpy.ga.CrossValidation(in_geostat_layer, {out_point_feature_class})
NameErläuterungDatentyp
in_geostat_layer

Der geostatistische Layer, der analysiert werden soll.

Geostatistical Layer
out_point_feature_class
(optional)

Speichert die Statistiken zur Kreuzvalidierung an jeder Position im geostatistischen Layer.

Feature Class

Abgeleitete Ausgabe

NameErläuterungDatentyp
count

Gesamtzahl der verwendeten Stichproben.

Long
mean_error

Mean Error: Die gemittelte Differenz zwischen den gemessenen und den vorhergesagten Werten.

Double
root_mean_square

Root Mean Square Error: Gibt an, wie gut Ihr Modell die gemessenen Werte vorhersagt.

Double
average_standard

Average Standard Error: Der Durchschnitt der Standardfehler der Vorhersage.

Double
mean_standardized

Mean Standardized Error: Der Durchschnitt der standardisierten Fehler.

Double
root_mean_square_standardized

Root Mean Square Standardized Error. Dieser Wert sollte nahe 1 sein, wenn die Standardfehler der Vorhersage gültig sind.

Double
percent_in_90_interval

Prozent im 90-%-Intervall: Der Prozentsatz der Punkte, die in einem 90-prozentigen Konfidenzintervall der Kreuzvalidierung liegen. Dieser Wert sollte ungefähr 90 betragen.

Double
percent_in_95_interval

Prozent im 95-%-Intervall: Der Prozentsatz der Punkte, die in einem 95-prozentigen Konfidenzintervall der Kreuzvalidierung liegen. Dieser Wert sollte ungefähr 95 betragen.

Double
average_crps

Average CRPS: Der durchschnittliche Continuous Ranked Probability Score (CRPS) aller Punkte. Der CRPS ist ein Diagnoseinstrument, das die Abweichung von der prädiktiven kumulativen Verteilungsfunktion zu jedem beobachteten Datenwert misst. Dieser Wert sollte so klein wie möglich sein. Dieses Diagnoseinstrument hat Vorteile gegenüber anderen Diagnoseinstrumenten für Kreuzvalidierungen, da es die Daten mit einer vollständigen Verteilung anstatt mit Einzelpunktvorhersagen vergleicht. Die Berechnung dieser Statistik beinhaltet Simulationen und kann daher nicht in einer einfachen Formel ausgedrückt werden.

Double

Codebeispiel

CrossValidation – Beispiel 1 (Python-Fenster)

Es wird eine Kreuzvalidierung an einem geostatistischen Eingabe-Layer vorgenommen.

import arcpy
arcpy.env.workspace = "C:/gapyexamples/data"
cvResult = arcpy.CrossValidation_ga("C:/gapyexamples/data/kriging.lyr")
print("Root Mean Square error = " + str(cvResult.rootMeanSquare))
CrossValidation – Beispiel 2 (eigenständiges Skript)

Es wird eine Kreuzvalidierung an einem geostatistischen Eingabe-Layer vorgenommen.

# Name: CrossValidation_Example_02.py
# Description: Perform cross validation on an input geostatistical layer.
# Requirements: Geostatistical Analyst Extension

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/gapyexamples/data"

# Set local variables
inLayer = "C:/gapyexamples/data/kriging.lyr"

# Execute CrossValidation
cvResult = arcpy.CrossValidation_ga(inLayer)
print("Root Mean Square error = " + str(cvResult.rootMeanSquare))

Lizenzinformationen

  • Basic: Erfordert Geostatistical Analyst
  • Standard: Erfordert Geostatistical Analyst
  • Advanced: Erfordert Geostatistical Analyst

Verwandte Themen