Geostatistische Layer vergleichen (Geostatistical Analyst)

Mit der Geostatistical Analyst-Lizenz verfügbar.

Zusammenfassung

Vergleicht geostatistische Layer anhand von benutzerdefinierbaren Kriterien, die auf Kreuzvalidierungsstatistiken basieren, und ordnet sie an.

Interpolationsergebnisse können basierend auf einem einzelnen Kriterium (z. B. der höchsten Vorhersagegenauigkeit oder der geringsten Verzerrung), dem gewichteten Durchschnitt mehrerer Kriterien oder der hierarchischen Sortierung mehrerer Kriterien (hier werden gleiche Werte zwischen den Kriterien durch das nachfolgende Kriterium in der Hierarchie aufgehoben) angeordnet werden. Zudem können mithilfe von Ausschlusskriterien Interpolationsergebnisse, die nicht die minimalen Qualitätsstandards erfüllen, aus dem Vergleich ausgeschlossen werden. Als Ausgabe entsteht eine Tabelle mit einer Zusammenfassung der Kreuzvalidierungsstatistiken und Ränge für die einzelnen Interpolationsergebnisse. Optional kann die Ausgabe auch ein geostatistischer Layer des Interpolationsergebnisses mit dem höchsten Rang sein, den Sie dann in künftigen Workflows verwenden können.

Abbildung

Abbildung des Werkzeugs "Geostatistische Layer vergleichen"
Interpolationsergebnisse werden verglichen und angeordnet.

Verwendung

  • Bei der Kreuzvalidierung handelt es sich um eine Leave-one-out-Methode zur Bewertung von Interpolationsergebnissen. Bei dieser Methode werden die einzelnen Punkte sequenziell aus dem Dataset entfernt. Anschließend wird mithilfe der verbleibenden Punkte der Wert des ausgeschlossenen Punktes vorhergesagt. Die Vorhersage aus der Kreuzvalidierung wird dann mit dem wahren Wert des ausgeblendeten Punkts verglichen, wobei die Differenz zwischen den beiden den Kreuzvalidierungsfehler ergibt (der Fehler kann positiv oder negativ sein). Die Logik hinter der Kreuzvalidierung ist folgende: Wenn das Interpolationsergebnis die Werte der ausgeblendeten Punkte gut vorhersagen kann, dürfte es ebenfalls unbekannte Werte an neuen Positionen gut vorhersagen können. Genau darin besteht das Ziel der Interpolation. Sämtliche von diesem Werkzeug verwendeten Kriterien basieren auf Summenstatistiken der Ergebnisse der Kreuzvalidierung.

    Die Bewertung der Ergebnisse mittels Kreuzvalidierungs-Summenstatistiken ist zwar eine bequeme und wirksame Methode, um mehrere Interpolationsergebnisse miteinander zu vergleichen. Sie ersetzt jedoch nicht das Expertenwissen in Bezug auf die Daten und die interaktive Untersuchung der Ergebnisse. Bei der Überprüfung von Diagrammen und einzelnen Kreuzvalidierungsfehlern treten häufig Muster in den Ergebnissen zutage, die in den Summenstatistiken nicht erkennbar waren. Zum Beispiel weisen die Kreuzvalidierungsfehler häufig räumliche Muster auf, in denen manche Bereiche niedriger und mache höher geschätzt werden; solche Muster werden in Summenstatistiken möglicherweise nicht dargestellt.

    Weitere Informationen über die Kreuzvalidierung zur Bewertung von Interpolationsergebnissen

  • Der Parameter Vergleichsmethode hat drei Optionen für den Vergleich der Kreuzvalidierungsstatistiken der Interpolationsergebnisse. Jede Option hat Vor- und Nachteile:

    • Einzelnes Kriterium: Der Vergleich und die Anordnung der Ergebnisse erfolgt auf der Basis eines einzelnen Kriteriums. Sie können die Ergebnisse nach höchster Vorhersagegenauigkeit, geringster Verzerrung, geringstem Worst-Case-Fehler, höchster Standardfehler-Genauigkeit oder höchster Präzision anordnen. Das Kriterium wird durch den Parameter Kriterium bereitgestellt.
      • Vorteile: Diese Option ist eine simple und gängige Methode für den Vergleich von Interpolationsergebnissen, die bekanntermaßen stabil und konsistent sind. Sie eignet sich auch für die Auswahl eines Ergebnisses aus mehreren Ergebnissen, die eine große Ähnlichkeit aufweisen.
      • Nachteile: Häufig führen einige Kriterien zu guten Interpolationsergebnissen, andere jedoch nicht, z. B. wenn sie eine hohe Vorhersagegenauigkeit, aber auch eine hohe Verzerrung aufweisen. In diesem Fall erhalten bei der Anordnung nach einem einzelnen Kriterium instabile oder irreführende Ergebnisse hohe Rangstufen. Bei der Anordnung nach einem einzelnen Kriterium empfiehlt es sich, mehrere Optionen des Parameters Ausschlusskriterien zu verwenden, damit instabile oder fehlende Ergebnisse vor dem Vergleich entfernt werden.
    • Hierarchische Sortierung mit Toleranz: Die hierarchische Sortierung dient dem Vergleich und der Anordnung von Ergebnissen. Im Parameter Hierarchie der Kriterien werden mehrere Kriterien nach Priorität angegeben (höchste Priorität zuerst). Die Interpolationsergebnisse werden nach dem ersten Kriterium sortiert, wobei etwaige gleiche Werte durch das zweite Kriterium aufgehoben werden. Gleiche Werte in Bezug auf das zweite Kriterium werden durch das dritte Kriterium aufgehoben usw. Diese Prozess ist an die Benutzerdefinierte Sortierung und die hierarchische Sortierung in Tabellenkalkulationssoftware angelehnt (Sortierung nach A, dann nach B, dann nach C usw.). Da es sich bei Kreuzvalidierungsstatistiken allerdings um kontinuierliche Werte handelt, die im Allgemeinen zu keinen exakten gleichen Werten führen, können Toleranzen (prozentual oder absolut) angegeben werden, sodass es in jedem der Kriterien gleiche Werte geben kann.
      • Vorteile: Bei dieser Option werden mehrere Kriterien verwendet, und es wird der relative Unterschied der Kreuzvalidierungsstatistiken berücksichtigt. Wenn zum Beispiel ein Interpolationsergebnis aufgrund des Kriteriums der höchsten Priorität wesentlich besser ist als der Rest, erhält es unabhängig vom folgenden Kriterium in der Hierarchie die höchste Rangstufe.
      • Nachteile: Die Wirksamkeit der hierarchischen Sortierung ist von den angegebenen Toleranzwerten abhängig. Wenn die Toleranzen zu gering sind, werden einige Kriterien möglicherweise nicht verwendet, weil es keine gleichen Werte aufzuheben gibt. Wenn die Toleranzen zu groß sind, kann es in den Rangfolgen viele gleiche Werte geben, weil viele Ergebnisse innerhalb ihrer jeweiligen Toleranzen liegen.
    • Rangstufe "Gewichteter Durchschnitt": Anhand des gewichteten Durchschnitts mehrerer Kriterien werden Ergebnisse verglichen und angeordnet. Mehrere Kriterien und ihre jeweiligen Gewichtungen werden über den Parameter Gewichtete Kriterien angegeben. Die Interpolationsergebnisse werden unabhängig von den einzelnen Kriterien angeordnet, wobei die endgültige Rangfolge anhand eines gewichteten Durchschnitts der Ränge ermittelt wird. Da höher gewichtete Kriterien einen größeren Einfluss auf die endgültigen Ränge haben, kann mit ihnen bestimmten Kriterien Vorrang gegenüber anderen Kriterien gewährt werden.
      • Vorteile: Bei dieser Option werden mehrere Kriterien verwendet, mit ihr kann die Präferenz für bestimmte Kriterien gegenüber anderen angezeigt werden, und es werden immer alle Kriterien in den Vergleich einbezogen.
      • Nachteile: Die relativen Unterschiede in den Werten der Kreuzvalidierungsstatistik bleiben unberücksichtigt. Zum Beispiel kann es vorkommen, dass alle RMS-Fehlerwerte innerhalb eines sehr kleinen Toleranzbereichs liegen (was darauf hindeutet, dass alle Ergebnisse in etwa dieselbe Vorhersagegenauigkeit aufweisen), aber in Bezug auf die Vorhersagegenauigkeit trotzdem von 1 bis n angeordnet sind (bei n Interpolationsergebnissen). Allerdings können die Mean-Error-Werte zwischen den Ergebnissen beträchtlich variieren (was darauf hindeutet, dass die Ergebnisse große Verzerrungsunterschiede aufweisen) und trotzdem in Bezug auf das Kriterium der Verzerrung von 1 bis n angeordnet werden. In den gewichteten Durchschnitt gehen nur die Ränge der Kriterien ein, wobei die relativen Unterschiede in den Kreuzvalidierungsstatistiken in der Rangfolge ignoriert werden.

  • Die geostatistischen Eingabe-Layer können mit dem Geostatistical Wizard oder mit den Werkzeugen im Toolset "Interpolation" erstellt werden.

  • Die Ausgabe ist eine Tabelle mit einer Zusammenfassung der Kreuzvalidierungsstatistiken, Beschreibungen der Interpolationsergebnisse und Anordnungen, die in eine Präsentation oder in einen Bericht eingebunden werden kann. Kreuzvalidierungsstatistiken sind nur dann in der Tabelle enthalten, wenn sie für mindestens ein Interpolationsergebnis gelten. Wenn zum Beispiel nur inverse Distanzgewichtungs- und radiale Basisfunktionen verwendet werden, enthält die Ausgabetabelle kein Feld mit Average-Standard-Error-Werten, weil sich mit diesen Methoden keine Standardfehler-Werte berechnen lassen. Wenn eine Statistik nur für einige, aber nicht für alle Interpolationsergebnisse gilt, ist der Wert für Ergebnisse, für die die Statistik nicht gilt, NULL. Des Weiteren sind, wenn einer der geostatistischen Eingabe-Layer mit dem Werkzeug Empirical Bayesian Kriging, Regressionsvorhersage mit EBK oder Empirical Bayesian Kriging 3D erstellt wurde, mehrere Kreuzvalidierungsstatistiken in der Tabelle enthalten, die nicht von einem Kriterium dieses Werkzeugs verwendet werden. Diese dienen lediglich zu Informationszwecken und weisen für alle anderen Interpolationsmethoden NULL-Werte auf. Wenn die Rangstufe "Gewichteter Durchschnitt" verwendet wird, enthält die Tabelle auch die Rangstufen für alle bereitgestellten Kriterien und ihren gewichteten Durchschnitt.

    Optional können Sie mit dem Parameter Geostatistischen Layer mit höchster Rangstufe ausgeben eine Kopie des geostatistischen Eingabe-Layers mit der höchsten Rangstufe erstellen. Das bietet sich bei der Skripterstellung in ModelBuilder und Python an, um automatisch das beste Interpolationsergebnis an nachfolgende Werkzeuge weiterzugeben.

  • Während der Ausführung des Werkzeugs wird das aktuell berechnete Interpolationsergebnis in Form von Geoverarbeitungsmeldungen und Meldungen in der Fortschrittsleiste angezeigt. Nach der Berechnung und dem Vergleich aller Ergebnisse werden die Ränge als Geoverarbeitungsmeldungen ausgegeben. Die Ränge können zudem der Ausgabe-Kreuzvalidierungstabelle entnommen werden

  • Mit dem Werkzeug Explorative Interpolation lassen sich dieselben Kreuzvalidierungsvergleiche wie mit diesem Werkzeug durchführen; es generiert allerdings vor dem Vergleich und der Anordnung automatisch verschiedene Interpolationsergebnisse aus Eingabepunkten und einem Feld.

  • In der folgenden Tabelle werden die verfügbaren Kriterien, die Kreuzvalidierungsstatistiken zur Messung der Kriterien und die Formeln für die Zuweisung einer Punktzahl zu den Interpolationsergebnissen aufgeführt (wobei kleinere Zahlenwerte besser sind). Die Ränge für die Kriterien ergeben sich durch die Sortierung der Punktzahlen der einzelnen Interpolationsergebnisse.

    Hinweis:

    Bei drei Kriterien entspricht die Punktzahl der Kreuzvalidierungsstatistik.

    KriterienKreuzvalidierungsstatistikBerechnungsformel

    Höchste Vorhersagegenauigkeit

    Root Mean Square Error

    Die Ergebnisse werden nach dem kleinsten RMS-Fehler angeordnet.

    Score = RootMeanSquareError

    Geringste Verzerrung

    Mean Error

    Die Ergebnisse werden nach dem Mean Error angeordnet, der am nächsten an Null liegt.

    Score = AbsoluteValue( MeanError )

    Geringster Worst-Case-Fehler

    Maximaler absoluter Fehler

    Die Ergebnisse werden nach dem kleinsten maximalen absoluten Fehler angeordnet.

    Score = MaximumAbsoluteError

    Höchste Standardfehler-Genauigkeit

    Root Mean Square Standardized-Fehler

    Die Ergebnisse werden nach dem Root Mean Square Standardized-Fehler angeordnet, der am nächsten an Eins liegt.

    Score = AbsoluteValue( RMSStdError - 1 )

    Höchste Präzision

    Average Standard Error

    Die Ergebnisse werden nach dem kleinsten Average Standard Error angeordnet.

    Score = AverageStandardError

  • Wenn es gleiche Werte in einem der Kriterien gibt, erhalten alle gleichrangigen Ergebnisse dieselbe Rangstufe; diese entspricht dem höchsten der ihnen gemeinsamen Ränge (wobei ein höherer Rang eine kleinere Rangfolgenummer bedeutet). Zum Beispiel erhalten die Root Mean Square Error-Werte (12, 14, 14, 15, 16, 16, 18), sortiert von der besten zur schlechtesten Option, in Bezug auf das Kriterium der Vorhersagegenauigkeit die Ränge (1, 2, 2, 4, 5, 5, 7). Die Ränge 3 und 6 werden aufgrund der gleichrangigen Werte ausgelassen.

    Gleiche Werte können in verschiedenen Stadien der Vergleiche auftreten. Am häufigsten treten sie in der hierarchischen Sortierung auf, weil alle Ergebnisse innerhalb der Toleranz als gleichrangig angesehen werden, ebenso wie alle anderen Ergebnisse, die außerhalb der Toleranz liegen. Zu gleichen Werten kommt es zudem häufig bei der Rangstufe "Gewichteter Durchschnitt", wenn die Interpolationsergebnisse durch unterschiedliche Kriterien verschiedene Ränge aufweisen, was dazu führen kann, dass die Durchschnittswerte in den Rängen gleich gewichtet sind. Weniger häufig treten gleiche Werte auch bei Vergleichen mit einzelnen Kriterien auf (wenn z. B. alle Punkte einen konstanten Wert aufweisen). Gleiche Werte, die auf einzelnen Kriterien beruhen, wirken sich auch auf die Rangstufe "Gewichteter Durchschnitt" aus, wenn die Kriterien im gewichteten Durchschnitt verwendet werden.

  • Geben Sie die Toleranzen bei der hierarchischen Sortierung relativ zur Punktzahl des Kriteriums und nicht der Kreuzvalidierungsstatistik an. Bei Kriterien, deren Punktzahl der Statistik gleicht (höchste Vorhersagegenauigkeit, geringster Worst-Case-Fehler und höchste Präzision), sind die Toleranzwerte in der Regel eindeutig. Wenn beispielsweise der geringste RMS-Fehlerwert in den Interpolationsergebnissen bei 200 liegt, werden bei einer Toleranz von 10 Prozent alle Ergebnisse einbezogen, deren RMS-Fehlerwerte kleiner oder gleich 220 sind: 200 + (10/100) x 200 = 220. Entsprechend werden bei einer absoluten Toleranz von 15 alle Ergebnisse einbezogen, deren RMS-Fehlerwerte kleiner oder gleich 215 sind: 200 + 15 = 215.

    Bei Kriterien, deren Punktzahl der Statistik nicht gleicht (geringste Verzerrung und höchste Standardfehler-Genauigkeit), sind die entsprechenden Toleranzwerte weniger eindeutig. In der Mean-Error-Statistik wird die Verzerrung als absoluter Wert des Mean Error ausgedrückt. Das bedeutet, dass die Mean-Error-Werte -4 und 6 einen relativen Unterschied von 50 Prozent aufweisen, weil ihre absoluten Werte sich um 50 Prozent unterscheiden: ABS(-4) + (50/100) x ABS(-4) = ABS(6). Entsprechend liegt ihr absoluter Unterschied bei 2: ABS(-4) + 2 = ABS(6).

    Bei der Statistikmethode "Root Mean Square Standardized-Fehler" wird die Standardfehler-Genauigkeit als absoluter Unterschied zwischen dem Root Mean Square Standardized-Fehlerwert und dem idealen Wert 1 ausgedrückt. Das bedeutet zum Beispiel, dass zwischen den Root Mean Square Standardized-Fehlerwerten 0,2 und 2,4 ein relativer Unterschied von 75 Prozent besteht. Um zu verstehen, warum das so ist, müssen die Werte 0,2 und 2,4 miteinander verglichen werden. Letzterer ist 1,75-mal (also 75 Prozent) weiter vom idealen Wert 1 entfernt als Ersterer (daraus ergibt sich ein absoluter Unterschied von 0,8 bzw. 1,4): ABS(0.2 - 1) + (75/100) x ABS(0.2 - 1) = ABS(2.4 - 1). Entsprechend liegt ihr absoluter Unterschied bei 0,6: ABS(0.2 - 1) + 0.6 = ABS(2.4 - 1).

  • Bei mehreren Kriterien müssen alle geostatistischen Eingabe-Layer den Ausgabetyp "Standardfehler" unterstützen. Wenn einer der geostatistischen Layer keine Standardfehler zulässt, sind einige Optionen mehrerer Parameter nicht mehr verfügbar. Diese Optionen stehen in Beziehung mit der Genauigkeit und der Präzision des Standardfehlers und der Statistikmethode "Root Mean Square Standardized-Fehler" oder "Average Standard Error". Auf der kontextbezogenen Registerkarte Geostatistischer Layer enthält das Menü Anzeigetyp in der Gruppe Darstellung die unterstützten Ausgabetypen eines geostatistischen Layers.

    Weitere Informationen darüber, welche Interpolationsmethoden Standardfehler von Vorhersagen zulassen

  • Die Option Minimale prozentuale Fehlerreduktion des Parameters Ausschlusskriterien ist besonders nützlich, wenn die Werte oder der Bereich der zu interpolierenden Punkte unbekannt sind (z. B. in automatisierten Umgebungen). Bei dieser Option werden Interpolationsergebnisse ausgeschlossen, die nicht signifikant genauer sind als ein nicht-räumliches Basislinienmodell, das den globalen Durchschnittswert an allen Positionen der Karte vorhersagt. Diese relative Genauigkeit wird durch Vergleichen des RMS-Fehlers mit der Standardabweichung der Werte der zu interpolierenden Punkte gemessen, wobei der RMS-Fehler mindestens der Differenz aus dem angegebenem Prozentsatz und der Standardabweichung, die in den Vergleich einbezogen werden soll, entsprechen muss. Der Wert 10 bedeutet zum Beispiel, dass der RMS-Fehler mindestens 10 Prozent geringer sein muss als die Standardabweichung, die in den Vergleich und die Rangfolge einbezogen werden soll.

    In verschiedenen wissenschaftlichen Disziplinen haben sich unterschiedliche Standards für akzeptable Fehlerreduktionsquoten in Interpolationsergebnissen etabliert. In den Naturwissenschaften lassen sich Fehler aufgrund von Messungen mit hoher Stichprobendichte häufig um über 90 Prozent reduzieren. In den Gesellschaftswissenschaften hingegen liegen die Fehlerreduktionsquoten lediglich zwischen 10 und 20 Prozent und sind somit häufig für die Forscher signifikant.

  • Damit die Vergleiche sinnvoll und gleichzusetzen sind, empfiehlt es sich, bei der Erstellung der geostatistischen Eingabe-Layer dieselben Punkte und dasselbe Feld zu verwenden. Wenn einer der Layer nicht dieselbe Datenquelle hat, gibt das Werkzeug eine Warnmeldung aus.

Parameter

BeschriftungErläuterungDatentyp
Geostatistische Eingabe-Layer

Die geostatistischen Layer, die die Interpolationsergebnisse abbilden. Jeder Layer wird verglichen und angeordnet.

Geostatistical Layer
Ausgabe-Kreuzvalidierungstabelle

Die Ausgabetabelle mit einer Zusammenfassung der Kreuzvalidierungsstatistiken und Ränge für die einzelnen Interpolationsergebnisse. Die endgültigen Ränge der Interpolationsergebnisse werden im Feld RANK gespeichert.

Table
Geostatistischer Ausgabe-Layer mit der höchsten Rangstufe
(optional)

Der geostatistische Ausgabe-Layer des Interpolationsergebnisses mit dem höchsten Rang. Bei diesem Interpolationsergebnis weist das Feld RANK der Ausgabe-Kreuzvalidierungstabelle den Wert 1 auf. Falls das Interpolationsergebnis mit der höchsten Rangstufe gleiche Werte aufweist oder alle Ergebnisse durch Ausschlusskriterien ausgeschlossen wurden, wird der Layer nicht erstellt, auch wenn ein Wert angegeben wurde. Wenn dies passiert, gibt das Werkzeug Warnmeldungen aus.

Geostatistical Layer
Vergleichsmethode
(optional)

Gibt die Methode an, mit der die Interpolationsergebnisse verglichen und angeordnet werden.

  • Einzelnes KriteriumFür den Vergleich und die Anordnung der Ergebnisse wird ein einzelnes Kriterium wie die höchste Vorhersagegenauigkeit oder die geringste Verzerrung verwendet. Es wird das Kriterium aus dem Parameter Kriterium verwendet.
  • Hierarchische Sortierung mit ToleranzDie Ergebnisse werden mittels hierarchischer Sortierung miteinander verglichen. Im Parameter Hierarchie der Kriterien werden mehrere Kriterien nach Priorität angegeben (höchste Priorität zuerst). Die Interpolationsergebnisse werden nach dem ersten Kriterium sortiert, wobei etwaige gleiche Werte durch das zweite Kriterium aufgehoben werden. Gleiche Werte in Bezug auf das zweite Kriterium werden durch das dritte Kriterium aufgehoben usw. Da es sich bei Kreuzvalidierungsstatistiken um kontinuierliche Werte handelt, die im Allgemeinen zu keinen exakten gleichen Werten führen, können Toleranzen (prozentual oder absolut) angegeben werden, sodass es in jedem der Kriterien gleiche Werte geben kann.
  • Rangstufe "Gewichteter Durchschnitt"Die Ergebnisse werden mithilfe des gewichteten Durchschnitts mehrerer Kriterien miteinander verglichen. Mehrere Kriterien und ihre jeweiligen Gewichtungen werden über den Parameter Gewichtete Kriterien angegeben. Die Interpolationsergebnisse werden unabhängig von den einzelnen Kriterien angeordnet, wobei die endgültige Rangfolge anhand eines gewichteten Durchschnitts der Ränge ermittelt wird. Da höher gewichtete Kriterien einen größeren Einfluss auf die endgültigen Ränge haben, können Gewichtungen verwendet werden, um den Vorrang bestimmter Kriterien gegenüber anderen anzugeben.
String
Kriterium
(optional)

Gibt das Kriterium an, mit denen den Interpolationsergebnissen Rangfolgewerte zugewiesen werden.

  • Höchste VorhersagegenauigkeitDie Ergebnisse werden nach dem geringsten RMS-Fehler sortiert. Durch diese Option wird gemessen, wie genau die Vorhersagen der Kreuzvalidierung im Durchschnitt mit den wahren Werten übereinstimmen. Dies ist die Standardeinstellung.
  • Geringste VerzerrungDie Ergebnisse werden nach dem Mean Error angeordnet, der am nächsten an Null liegt. Durch diese Option wird gemessen, in welchem Ausmaß die Vorhersagen der Kreuzvalidierung im Durchschnitt den wahren Werten über- oder unterschätzen. Interpolationsergebnisse mit positivem Mean-Error-Werten führen zu einer systematischen Überschätzung (positive Verzerrung) und Ergebnisse mit negativen Mean-Error-Werten zu einer systematischen Unterschätzung (negative Verzerrung) des wahren Werts.
  • Geringster Worst-Case-FehlerDie Ergebnisse werden nach dem geringsten maximalen absoluten Fehler sortiert. Durch diese Option wird nur die einzelne ungenaueste Kreuzvalidierungsvorhersage (positiv oder negativ) gemessen. Dies empfiehlt sich, wenn es Ihnen hauptsächlich um Worst-Case-Szenarien und weniger um die Genauigkeit unter typischen Bedingungen geht.
  • Höchste Standardfehler-GenauigkeitDie Ergebnisse werden nach dem Root Mean Square Standardized-Fehler angeordnet, der am nächsten an Eins liegt. Durch diese Option wird gemessen, wie genau die Variabilität der Vorhersagen der Kreuzvalidierung mit den geschätzten Standard Errors übereinstimmt. Dies empfiehlt sich, wenn Sie für die Vorhersagen Konfidenzintervalle oder Fehlerspannen erstellen möchten.
  • Höchste PräzisionDie Ergebnisse werden nach dem geringsten Average Standard Error sortiert. Wenn Sie für die vorhergesagten Werte Konfidenzintervalle oder Fehlerspannen erstellen, weisen die Vorhersagen bei Ergebnissen mit höherer Präzision engere Intervalle auf. Mit dieser Option wird nicht gemessen, ob die Standard Errors richtig geschätzt werden, sondern nur, ob sie gering sind. Bei Verwendung der Option empfiehlt es sich, als Ausschlusskriterien den minimalen und maximalen Root Mean Square Standardized-Fehler einzubinden, damit die Standard Errors sowohl genau als auch präzise sind.
String
Hierarchie der Kriterien
(optional)

Die für die hierarchische Sortierung mit Toleranz verwendete Hierarchie der Kriterien. Geben Sie mehrere Kriterien nach Priorität an; führen Sie dabei das wichtigste zuerst auf. Die Interpolationsergebnisse werden nach dem ersten Kriterium sortiert, wobei etwaige gleiche Werte durch das zweite Kriterium aufgehoben werden. Gleiche Werte in Bezug auf das zweite Kriterium werden durch das dritte Kriterium aufgehoben usw. Da es sich bei Kreuzvalidierungsstatistiken um kontinuierliche Werte handelt, die im Allgemeinen zu keinen exakten gleichen Werten führen, können Toleranzen verwendet werden, um in den Kriterien gleiche Werte zu erzeugen. Geben Sie für jede Zeile in der ersten Spalte ein Kriterium, in der zweiten Spalte einen Toleranztyp (prozentual oder absolut) und in der dritten Spalte einen Toleranzwert an. Wird kein Toleranzwert angegeben, dann wird auch keine Toleranz verwendet; dies bietet sich besonders für die letzte Zeile an, da dann keine gleichen Werte für das Interpolationsergebnis mit dem höchsten Rang entstehen.

Für jede Zeile (Hierarchieebene) sind folgende Kriterien verfügbar:

  • RMS-Fehler (Genauigkeit): Die Ergebnisse werden nach der höchsten Genauigkeit sortiert.
  • Mean Error (Verzerrung): Die Ergebnisse werden nach der geringsten Verzerrung sortiert.
  • Maximaler absoluter Fehler (Worst-Case-Fehler): Die Ergebnisse werden nach dem geringsten Worst-Case-Fehler sortiert.
  • Root Mean Square Standardized-Fehler (Standardfehler-Genauigkeit): Die Ergebnisse werden nach der höchsten Standardfehler-Genauigkeit sortiert.
  • Average Standard Error (Präzision): Die Ergebnisse werden nach der höchsten Präzision sortiert.

Sie können zum Beispiel einen Wert für RMS-Fehler (Genauigkeit) mit einer Toleranz von 5 Prozent in die erste Zeile und einen Wert für Mean Error (Verzerrung) ohne Toleranz in die zweite Zeile eingeben. Bei diesen Optionen werden die Interpolationsergebnisse zuerst nach geringstem RMS-Fehler (höchste Vorhersagegenauigkeit) angeordnet, wobei alle Interpolationsergebnisse, deren RMS-Fehlerwerte maximal 5 Prozent vom genauesten Ergebnis entfernt liegen, von der Vorhersagegenauigkeit als gleiche Werte betrachtet werden. Unter den gleichrangigen Ergebnissen erhält dasjenige, dessen Mean Error der Null am nächsten liegt (geringste Verzerrung), den höchsten Rang.

Value Table
Gewichtete Kriterien
(optional)

Das Mehrfachkriterium mit Gewichtungen, mit denen den Interpolationsergebnissen Rangfolgewerte zugewiesen werden. Geben Sie für jede Zeile ein Kriterium und eine Gewichtung an. Die Interpolationsergebnisse werden unabhängig von den einzelnen Kriterien angeordnet, wobei die endgültige Rangfolge der Ergebnisse anhand eines gewichteten Durchschnitts der Ränge ermittelt wird.

  • Höchste Vorhersagegenauigkeit: Die Ergebnisse werden nach dem geringsten RMS-Fehler sortiert.
  • Geringste Verzerrung: Die Ergebnisse werden nach dem Mean Error angeordnet, der am nächsten an Null liegt.
  • Geringster Worst-Case-Fehler: Die Ergebnisse werden nach dem geringsten maximalen absoluten Fehler sortiert.
  • Höchste Standardfehler-Genauigkeit: Die Ergebnisse werden nach dem Root Mean Square Standardized-Fehler angeordnet, der am nächsten an Eins liegt.
  • Höchste Präzision: Die Ergebnisse werden nach dem geringsten Average Standard Error sortiert.

Value Table
Ausschlusskriterien
(optional)

Die Kriterien und ihre jeweiligen Werte für den Ausschluss der Interpolationsergebnisse aus dem Vergleich. Ausgeschlossene Ergebnisse erhalten keine Rangstufe und weisen im Feld Included der Ausgabe-Kreuzvalidierungstabelle den Wert No auf.

  • Maximaler RMS-Fehler: Die Ergebnisse werden ausgeschlossen, wenn der RMS-Fehler den angegebenen Wert überschreitet. Der Wert darf nicht negativ sein. Diese Option misst die Vorhersagegenauigkeit.
  • Maximaler absoluter Fehler: Die Ergebnisse werden ausgeschlossen, wenn der maximale absolute Fehler den angegebenen Wert überschreitet. Der Wert darf nicht negativ sein. Diese Option misst den Worst-Case-Fehler.
  • Maximaler Root Mean Square Standardized-Fehler: Die Ergebnisse werden ausgeschlossen, wenn der RMS-Fehler den angegebenen Wert überschreitet. Der Wert muss größer als oder gleich 1 sein. Diese Option misst die Standardfehler-Genauigkeit.
  • Minimaler Root Mean Square Standardized-Fehler: Die Ergebnisse werden ausgeschlossen, wenn der Root Mean Square Standardized-Fehler den angegebenen Wert nicht überschreitet. Der Wert muss zwischen 0 und 1 liegen. Diese Option misst die Standardfehler-Genauigkeit.
  • Maximaler Mean Error: Die Ergebnisse werden ausgeschlossen, wenn der Mean Error den angegebenen Wert überschreitet. Der Wert darf nicht negativ sein. Diese Option misst die Verzerrung.
  • Minimaler Mean Error: Die Ergebnisse werden ausgeschlossen, wenn der Mean Error den angegebenen Wert nicht überschreitet. Der Wert darf nicht positiv sein. Diese Option misst die Verzerrung.
  • Maximaler Average Standard Error: Die Ergebnisse werden ausgeschlossen, wenn der Average Standard Error den angegebenen Wert überschreitet. Der Wert darf nicht negativ sein. Diese Option misst die Genauigkeit.
  • Minimale prozentuale Fehlerreduktion: Die Ergebnisse werden ausgeschlossen, wenn das Interpolationsergebnis nicht signifikant genauer ist als ein nichträumliches Basislinienmodell, das den globalen Durchschnittswert an allen Positionen der Karte vorhersagt. Diese relative Genauigkeit wird durch Vergleichen des RMS-Fehlers mit der Standardabweichung der Werte der zu interpolierenden Punkte gemessen, wobei der RMS-Fehler mindestens der Differenz aus dem angegebenem Prozentsatz und der Standardabweichung, die in den Vergleich einbezogen werden soll, entsprechen muss. Der Wert 10 bedeutet zum Beispiel, dass der RMS-Fehler mindestens 10 Prozent geringer sein muss als die Standardabweichung, die in den Vergleich und die Rangfolge einbezogen werden soll. Der Wert muss zwischen 0 und 100 liegen. Diese Option misst die Vorhersagegenauigkeit.

Value Table

arcpy.ga.CompareGeostatisticalLayers(in_geostat_layers, out_cv_table, {out_geostat_layer}, {comparison_method}, {criterion}, {criteria_hierarchy}, {weighted_criteria}, {exclusion_criteria})
NameErläuterungDatentyp
in_geostat_layers
[in_geostat_layer1,in_geostat_layer2,...]

Die geostatistischen Layer, die die Interpolationsergebnisse abbilden. Jeder Layer wird verglichen und angeordnet.

Geostatistical Layer
out_cv_table

Die Ausgabetabelle mit einer Zusammenfassung der Kreuzvalidierungsstatistiken und Ränge für die einzelnen Interpolationsergebnisse. Die endgültigen Ränge der Interpolationsergebnisse werden im Feld RANK gespeichert.

Table
out_geostat_layer
(optional)

Der geostatistische Ausgabe-Layer des Interpolationsergebnisses mit dem höchsten Rang. Bei diesem Interpolationsergebnis weist das Feld RANK der Ausgabe-Kreuzvalidierungstabelle den Wert 1 auf. Falls das Interpolationsergebnis mit der höchsten Rangstufe gleiche Werte aufweist oder alle Ergebnisse durch Ausschlusskriterien ausgeschlossen wurden, wird der Layer nicht erstellt, auch wenn ein Wert angegeben wurde. Wenn dies passiert, gibt das Werkzeug Warnmeldungen aus.

Geostatistical Layer
comparison_method
(optional)

Gibt die Methode an, mit der die Interpolationsergebnisse verglichen und angeordnet werden.

  • SINGLEFür den Vergleich und die Anordnung der Ergebnisse wird eine einzelne Kreuzvalidierungsstatistik wie die höchste Vorhersagegenauigkeit oder die geringste Verzerrung verwendet. Es wird das Kriterium aus dem Parameter criterion verwendet.
  • SORTINGDie Ergebnisse werden mittels hierarchischer Sortierung miteinander verglichen. Im Parameter criteria_hierarchy werden mehrere Kriterien nach Priorität angegeben (höchste Priorität zuerst). Die Interpolationsergebnisse werden nach dem ersten Kriterium sortiert, wobei etwaige gleiche Werte durch das zweite Kriterium aufgehoben werden. Gleiche Werte in Bezug auf das zweite Kriterium werden durch das dritte Kriterium aufgehoben usw. Da es sich bei Kreuzvalidierungsstatistiken um kontinuierliche Werte handelt, die im Allgemeinen zu keinen exakten gleichen Werten führen, können Toleranzen (prozentual oder absolut) angegeben werden, sodass es in jedem der Kriterien gleiche Werte geben kann.
  • AVERAGE_RANKDie Ergebnisse werden mithilfe des gewichteten Durchschnitts mehrerer Kriterien miteinander verglichen. Mehrere Kriterien und ihre jeweiligen Gewichtungen werden über den Parameter weighted_criteria angegeben. Die Interpolationsergebnisse werden unabhängig von den einzelnen Kriterien angeordnet, wobei die endgültige Rangfolge anhand eines gewichteten Durchschnitts der Ränge ermittelt wird. Da höher gewichtete Kriterien einen größeren Einfluss auf die endgültigen Ränge haben, können Gewichtungen verwendet werden, um den Vorrang bestimmter Kriterien gegenüber anderen anzugeben.
String
criterion
(optional)

Gibt das Kriterium an, mit denen den Interpolationsergebnissen Rangfolgewerte zugewiesen werden.

  • ACCURACYDie Ergebnisse werden nach dem geringsten RMS-Fehler sortiert. Durch diese Option wird gemessen, wie genau die Vorhersagen der Kreuzvalidierung im Durchschnitt mit den wahren Werten übereinstimmen. Dies ist die Standardeinstellung.
  • BIASDie Ergebnisse werden nach dem Mean Error angeordnet, der am nächsten an Null liegt. Durch diese Option wird gemessen, in welchem Ausmaß die Vorhersagen der Kreuzvalidierung im Durchschnitt den wahren Werten über- oder unterschätzen. Interpolationsergebnisse mit positivem Mean-Error-Werten führen zu einer systematischen Überschätzung (positive Verzerrung) und Ergebnisse mit negativen Mean-Error-Werten zu einer systematischen Unterschätzung (negative Verzerrung) des wahren Werts.
  • WORST_CASEDie Ergebnisse werden nach dem geringsten maximalen absoluten Fehler sortiert. Durch diese Option wird nur die einzelne ungenaueste Kreuzvalidierungsvorhersage (positiv oder negativ) gemessen. Dies empfiehlt sich, wenn es Ihnen hauptsächlich um Worst-Case-Szenarien und weniger um die Genauigkeit unter typischen Bedingungen geht.
  • STANDARD_ERRORDie Ergebnisse werden nach dem Root Mean Square Standardized-Fehler angeordnet, der am nächsten an Eins liegt. Durch diese Option wird gemessen, wie genau die Variabilität der Vorhersagen der Kreuzvalidierung mit den geschätzten Standard Errors übereinstimmt. Dies empfiehlt sich, wenn Sie für die Vorhersagen Konfidenzintervalle oder Fehlerspannen erstellen möchten.
  • PRECISIONDie Ergebnisse werden nach dem geringsten Average Standard Error sortiert. Wenn Sie für die vorhergesagten Werte Konfidenzintervalle oder Fehlerspannen erstellen, weisen die Vorhersagen bei Ergebnissen mit höherer Präzision engere Intervalle auf. Mit dieser Option wird nicht gemessen, ob die Standard Errors richtig geschätzt werden, sondern nur, ob sie gering sind. Bei Verwendung der Option empfiehlt es sich, als Ausschlusskriterien den minimalen und maximalen Root Mean Square Standardized-Fehler einzubinden, damit die Standard Errors sowohl genau als auch präzise sind.
String
criteria_hierarchy
[[criteria1, tol_type1, tol_val1], [criteria2, tol_type2, tol_val2],...]
(optional)

Die für die hierarchische Sortierung mit Toleranz verwendete Hierarchie der Kriterien. Geben Sie mehrere Kriterien nach Priorität an; führen Sie dabei das wichtigste zuerst auf. Die Interpolationsergebnisse werden nach dem ersten Kriterium sortiert, wobei etwaige gleiche Werte durch das zweite Kriterium aufgehoben werden. Gleiche Werte in Bezug auf das zweite Kriterium werden durch das dritte Kriterium aufgehoben usw. Da es sich bei Kreuzvalidierungsstatistiken um kontinuierliche Werte handelt, die im Allgemeinen zu keinen exakten gleichen Werten führen, können Toleranzen verwendet werden, um in den Kriterien gleiche Werte zu erzeugen. Geben Sie für jede Zeile in der ersten Spalte ein Kriterium, in der zweiten Spalte einen Toleranztyp (prozentual oder absolut) und in der dritten Spalte einen Toleranzwert an. Wird kein Toleranzwert angegeben, dann wird auch keine Toleranz verwendet; dies bietet sich besonders für die letzte Zeile an, da dann keine gleichen Werte für das Interpolationsergebnis mit dem höchsten Rang entstehen.

Für jede Zeile (Hierarchieebene) sind folgende Kriterien verfügbar:

  • ACCURACY: Die Ergebnisse werden nach der höchsten Genauigkeit sortiert.
  • BIAS: Die Ergebnisse werden nach der geringsten Verzerrung sortiert.
  • WORST_CASE: Die Ergebnisse werden nach dem geringsten Worst-Case-Fehler sortiert.
  • STANDARD_ERROR: Die Ergebnisse werden nach der höchsten Standardfehler-Genauigkeit sortiert.
  • PRECISION: Die Ergebnisse werden nach der höchsten Präzision sortiert.

Sie können zum Beispiel einen Wert für ACCURACY mit einer Toleranz von 5 Prozent in die erste Zeile und einen Wert für BIAS ohne Toleranz in die zweite Zeile eingeben. Bei diesen Optionen werden die Interpolationsergebnisse zuerst nach geringstem RMS-Fehler (höchste Vorhersagegenauigkeit) angeordnet, wobei alle Interpolationsergebnisse, deren RMS-Fehlerwerte maximal 5 Prozent vom genauesten Ergebnis entfernt liegen, von der Vorhersagegenauigkeit als gleiche Werte betrachtet werden. Unter den gleichrangigen Ergebnissen erhält dasjenige, dessen Mean Error der Null am nächsten liegt (geringste Verzerrung), den höchsten Rang.

Value Table
weighted_criteria
[[criteria1, weight1], [criteria2, weight2],...]
(optional)

Das Mehrfachkriterium mit Gewichtungen, mit denen den Interpolationsergebnissen Rangfolgewerte zugewiesen werden. Geben Sie für jede Zeile ein Kriterium und eine Gewichtung an. Die Interpolationsergebnisse werden unabhängig von den einzelnen Kriterien angeordnet, wobei die endgültige Rangfolge der Ergebnisse anhand eines gewichteten Durchschnitts der Ränge ermittelt wird.

  • ACCURACY: Die Ergebnisse werden nach dem geringsten RMS-Fehler sortiert.
  • BIAS: Die Ergebnisse werden nach dem Mean Error angeordnet, der am nächsten an Null liegt.
  • WORST_CASE: Die Ergebnisse werden nach dem geringsten maximalen absoluten Fehler sortiert.
  • STANDARD_ERROR: Die Ergebnisse werden nach dem Root Mean Square Standardized-Fehler angeordnet, der am nächsten an Eins liegt.
  • PRECISION: Die Ergebnisse werden nach dem geringsten Average Standard Error sortiert.

Value Table
exclusion_criteria
[[criteria1, value1], [criteria2, value2],...]
(optional)

Die Kriterien und ihre jeweiligen Werte für den Ausschluss der Interpolationsergebnisse aus dem Vergleich. Ausgeschlossene Ergebnisse erhalten keine Rangstufe und weisen im Feld Included der Ausgabe-Kreuzvalidierungstabelle den Wert No auf.

  • MAX_RMSE: Die Ergebnisse werden ausgeschlossen, wenn der RMS-Fehler den angegebenen Wert überschreitet. Der Wert darf nicht negativ sein. Diese Option misst die Vorhersagegenauigkeit.
  • MAX_WORST_CASE: Die Ergebnisse werden ausgeschlossen, wenn der maximale absolute Fehler den angegebenen Wert überschreitet. Der Wert darf nicht negativ sein. Diese Option misst den Worst-Case-Fehler.
  • MAX_STD_RMSE: Die Ergebnisse werden ausgeschlossen, wenn der RMS-Fehler den angegebenen Wert überschreitet. Der Wert muss größer als oder gleich 1 sein. Diese Option misst die Standardfehler-Genauigkeit.
  • MIN_STD_RMSE: Die Ergebnisse werden ausgeschlossen, wenn der Root Mean Square Standardized-Fehler den angegebenen Wert nicht überschreitet. Der Wert muss zwischen 0 und 1 liegen. Diese Option misst die Standardfehler-Genauigkeit.
  • MAX_MEAN_ERROR: Die Ergebnisse werden ausgeschlossen, wenn der Mean Error den angegebenen Wert überschreitet. Der Wert darf nicht negativ sein. Diese Option misst die Verzerrung.
  • MIN_MEAN_ERROR: Die Ergebnisse werden ausgeschlossen, wenn der Mean Error den angegebenen Wert nicht überschreitet. Der Wert darf nicht positiv sein. Diese Option misst die Verzerrung.
  • MAX_ASE: Die Ergebnisse werden ausgeschlossen, wenn der Average Standard Error den angegebenen Wert überschreitet. Der Wert darf nicht negativ sein. Diese Option misst die Genauigkeit.
  • MIN_PERC_ERROR: Die Ergebnisse werden ausgeschlossen, wenn das Interpolationsergebnis nicht signifikant genauer ist als ein nicht-räumliches Basislinienmodell, das den globalen Durchschnittswert an allen Positionen der Karte vorhersagt. Diese relative Genauigkeit wird durch Vergleichen des RMS-Fehlers mit der Standardabweichung der Werte der zu interpolierenden Punkte gemessen, wobei der RMS-Fehler mindestens der Differenz aus dem angegebenem Prozentsatz und der Standardabweichung, die in den Vergleich einbezogen werden soll, entsprechen muss. Der Wert 10 bedeutet zum Beispiel, dass der RMS-Fehler mindestens 10 Prozent geringer sein muss als die Standardabweichung, die in den Vergleich und die Rangfolge einbezogen werden soll. Der Wert muss zwischen 0 und 100 liegen. Diese Option misst die Vorhersagegenauigkeit.

Value Table

Codebeispiel

CompareGeostatisticalLayers – Beispiel 1 (Python-Fenster)

Das folgende Python-Skript veranschaulicht, wie die Funktion CompareGeostatisticalLayers verwendet wird.

# Compare Simple kriging, EBK, and Kernel Interpolation results
# Rank results by highest prediction accuracy
# Exclude results with error reductions under 25%

myGALayers = ["Simple Kriging", "EBK", "Kernel Interpolation"]
outTable = "outCVtable"
outGALayer = "Result With Highest Rank"
compMethod = "SINGLE"
criterion = "ACCURACY"
exclCrit = [["MIN_PERC_ERROR", 25]]
arcpy.ga.CompareGeostatisticalLayers(myGALayers, outTable, outGALayer,
         compMethod, criterion, None, None, exclCrit)
CompareGeostatisticalLayers – Beispiel 2 (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht, wie die Funktion CompareGeostatisticalLayers verwendet wird.

# Compare various interpolation results
# Rank results by highest weighted average rank
# Rank same results by hierarchical sorting

# Import system modules
import arcpy

# Check out the ArcGIS Geostatistical Analyst extension license
arcpy.CheckOutExtension("GeoStats")

# Allow overwriting output
arcpy.env.overwriteOutput = True

### Set shared parameters
# Set input and output locations
directory = "C:/data/"
outgdb = directory + "out.gdb/"
arcpy.env.workspace = directory
# Three interpolation results to compare
myGALayers = ["EBK", "Universal Kriging", "Kernel Interpolation"]
# Exclude results with error reductions under 25%
exclCrit = [["MIN_PERC_ERROR", 25]]
# Output geostatistical layer with highest rank
outGALayer = "Result With Highest Rank"

### Set weighted average rank parameters
# Output table of ranks and cross validation results
outTable = outgdb + "outWeightedAverageTable"
# Use weighted average rank
compMethod = "AVERAGE_RANK"
# Use all criteria with highest weight to prediction accuracy
weightedCrit = [
            ["ACCURACY", 3],
            ["BIAS", 1],
            ["WORST_CASE", 1],
            ["STANDARD_ERROR", 1],
            ["PRECISION", 1]
               ]

# Compare using weighted average rank
arcpy.ga.CompareGeostatisticalLayers(myGALayers, outTable, outGALayer,
         compMethod, None, None, weightedCrit, exclCrit)



### Set hierarchical sorting parameters
# Output table of ranks and cross validation results
outTable = outgdb + "outHierSortTable"
# Use hierarchical sorting with tolerances
compMethod = "SORTING"
# Compare using highest prediction accuracy with a 10% tolerance
# Break ties by lowest bias
hierCrit = [
            ["ACCURACY", "PERCENT", 10],
            ["BIAS", "PERCENT", None]
           ]

# Compare using hierarchical sorting with tolerances
arcpy.ga.CompareGeostatisticalLayers(myGALayers, outTable, outGALayer,
         compMethod, None, hierCrit, None, exclCrit)

Lizenzinformationen

  • Basic: Erfordert Geostatistical Analyst
  • Standard: Erfordert Geostatistical Analyst
  • Advanced: Erfordert Geostatistical Analyst

Verwandte Themen