Regressionsvorhersage mit EBK (Geostatistical Analyst)

Mit der Geostatistical Analyst-Lizenz verfügbar.

Zusammenfassung

Die Regressionsvorhersage mit EBK ist eine geostatistische Interpolationsmethode, die Empirical Bayesian Kriging mit Rastern als erklärende Variablen verwendet, wobei von den Rastern bekannt ist, dass sie sich auf den Wert der zu interpolierenden Daten auswirken. Diese Methode kombiniert Kriging mit Regressionsanalysen, um Vorhersagen zu treffen, die genauer sind als jeweils mit Regression oder Kridging erzielte Vorhersagen.

Weitere Informationen zu Regressionsvorhersage mit EBK

Verwendung

  • Dieses Werkzeug unterstützt nur Vorhersagekarten-Ausgaben. Um Standardfehler-, Quantil- oder Wahrscheinlichkeitskarten zu erstellen, geben Sie einen geostatistischen Layer aus und wandeln ihn mit der Funktion GA-Layer in Raster in ein (oder mehrere) Raster um.

  • Diese Kriging-Methode funktioniert mit mäßig nichtstationären Eingabedaten.

  • Für diese Interpolationsmethode sind nur die Suchnachbarschaften Standard: Kreisförmig und Glätten: Kreisförmig zulässig.

  • Wenn eines Ihrer Eingabe-Raster der erklärenden Variablen viele NoData-Zellen enthält, kann der geostatistische Ausgabe-Layer möglicherweise nicht in der Karte visualisiert werden. Dies ist nicht weiter problematisch – die Berechnungen werden korrekt durchgeführt. Um die Ausgabe zu visualisieren, wandeln Sie Ihren geostatistischen Layer mit GA-Layer in Raster oder GA-Layer in Gitternetz in ein Raster um. Sie können ein Raster mit diesem Werkzeug auch direkt ausgeben, indem Sie den Parameter Ausgabe-Vorhersage-Raster verwenden.

  • Wenn sich die Eingabe-Features der abhängigen Variablen in einem geographischen Koordinatensystem befinden, werden alle Entfernungen anhand von Sehnenentfernungen berechnet. Weitere Informationen zu Sehnenentfernungen finden Sie im Abschnitt Entfernungsberechnungen für Daten in geographischen Koordinaten im Hilfethema "Was ist Empirical Bayesian Kriging?".

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Features der abhängigen Variablen

Die Eingabe-Punkt-Features mit dem Feld, das interpoliert wird.

Feature Layer
Feld der abhängigen Variablen

Das Feld der Eingabe-Features der abhängigen Variablen, das die Werte der abhängigen Variablen enthält. Dies ist das Feld, das interpoliert wird.

Field
Eingabe-Raster der erklärenden Variablen

Eingabe-Raster, die die erklärenden Variablen darstellen, die zum Erstellen des Regressionsmodells verwendet werden. Diese Raster sollten Variablen darstellen, die bekanntermaßen die Werte der abhängigen Variable beeinflussen. Wenn beispielsweise Temperaturdaten interpoliert werden, sollte ein Höhenraster als erklärende Variable verwendet werden, da die Temperatur von der Höhe beeinflusst wird. Sie können bis zu 62 erklärende Raster verwenden.

Raster Layer; Mosaic Layer
Geostatistischer Ausgabe-Layer

Der geostatistische Ausgabe-Layer, in dem das Ergebnis der Interpolation angezeigt wird.

Geostatistical Layer
Ausgabe-Vorhersage-Raster
(optional)

Das Ausgabe-Raster, in dem das Ergebnis der Interpolation angezeigt wird. Die Standardzellengröße ist das Maximum der Zellengrößen der Eingabe-Raster der erklärenden Variablen. Um eine andere Zellengröße zu verwenden, nutzen Sie die Umgebungseinstellung Zellengröße.

Raster Dataset
Ausgabe-Diagnose-Feature-Class
(optional)

Ausgabe-Polygon-Feature-Class, die die Regionen jedes lokalen Modells anzeigt und Felder mit Diagnoseinformationen für die lokalen Modelle enthält. Für jede Teilmenge wird ein Polygon erstellt, das die Punkte in der Teilmenge umgibt, sodass Sie direkt erkennen können, welche Punkte in den einzelnen Teilmengen verwendet werden. Gibt es z. B. 10 lokale Modelle, umfasst die Ausgabe 10 Polygone. Die Feature-Class enthält die folgenden Felder:

  • Anzahl der Hauptkomponenten (PrincComps): Die Anzahl der Hauptkomponenten, die als erklärende Variablen verwendet wurden. Der Wert ist immer kleiner als oder gleich der Anzahl an Rastern aus erklärenden Variablen.
  • Prozentsatz der Varianz (PercVar): Die prozentuale Varianz, die von den Hauptkomponenten erfasst wird. Dieser Wert ist größer als oder gleich dem Wert, der für den unten stehenden Parameter Minimaler kumulativer Prozentsatz der Varianz angegeben wird.
  • Root Mean Square Error (RMSE): Die Quadratwurzel der durchschnittlichen quadrierten Kreuzvalidierungsfehler. Je kleiner dieser Wert ist, desto besser passt das Modell.
  • Prozent im 90-%-Intervall (Perc90): Der Prozentsatz der Datenpunkte, die in einem 90-prozentigen Konfidenzintervall der Kreuzvalidierung liegen. Dieser Wert sollte im Idealfall ungefähr 90 betragen. Liegt der Wert deutlich unter 90, bedeutet dies, dass die Standardfehler als zu gering geschätzt wurden. Liegt der Wert deutlich über 90, bedeutet dies, dass die Standardfehler als zu hoch geschätzt wurden.
  • Prozent im 95-%-Intervall (Perc95): Der Prozentsatz der Datenpunkte, die in einem 95-prozentigen Konfidenzintervall der Kreuzvalidierung liegen. Dieser Wert sollte im Idealfall ungefähr 95 betragen. Liegt der Wert deutlich unter 95, bedeutet dies, dass die Standardfehler als zu gering geschätzt wurden. Liegt der Wert deutlich über 95, bedeutet dies, dass die Standardfehler als zu hoch geschätzt wurden.
  • Mean Absolute Error (MeanAbsErr): Der Durchschnitt der absoluten Werte der Kreuzvalidierungsfehler. Dieser Wert sollte so klein wie möglich sein. Der Wert ähnelt dem Root Mean Square Error, wird jedoch weniger stark durch Extremwerte beeinflusst.
  • Mean Error (MeanError): Der Mittelwert der Kreuzvalidierungsfehler. Dieser Wert sollte gegen null gehen. Ein Wert, der deutlich von Null abweicht, weist darauf hin, dass die Vorhersagen verzerrt sind.
  • Continuous Ranked Probability Score (CRPS): Der CRPS ist ein Diagnoseinstrument, das die Abweichung von der prädiktiven kumulativen Verteilungsfunktion zu jedem beobachteten Datenwert misst. Dieser Wert sollte so klein wie möglich sein. Dieses Diagnoseinstrument hat Vorteile gegenüber Diagnoseinstrumenten für Kreuzvalidierungen, da es die Daten mit einer vollständigen Verteilung anstatt mit Einzelpunktvorhersagen vergleicht.
Feature Class
Messwertfehler der abhängigen Variablen
(optional)

Ein Feld, das den Messfehler für jeden Punkt in den Features der abhängigen Variablen angibt. Für jeden Punkt sollte der Wert dieses Feldes einer Standardabweichung des gemessenen Wertes des Punktes entsprechen. Verwenden Sie dieses Feld, wenn die Messfehlerwerte nicht an jedem Punkt gleich sind.

Eine häufige Quelle nicht konstanter Messfehler ist, dass die Daten mit unterschiedlichen Geräten gemessen werden. Die Geräte können unterschiedlich genau sein und daher unterschiedliche Messfehler erzeugen. Beispiel: Ein Thermometer rundet auf das nächste ganze Grad, ein anderes rundet auf das nächste Zehntelgrad. Die Variabilität der Messwerte wird oft vom Hersteller des Messgeräts angegeben oder ist aus der empirischen Praxis bekannt.

Lassen Sie diesen Parameter leer, wenn es keine Messfehlerwerte gibt oder die Messfehlerwerte unbekannt sind.

Field
Minimaler kumulativer Prozentsatz der Varianz
(optional)

Definiert den minimalen kumulativen Prozentsatz der Varianz von Hauptkomponenten der Raster aus erklärenden Variablen. Vor dem Erstellen des Regressionsmodells werden die Hauptkomponenten der erklärenden Variablen berechnet, und diese Hauptkomponenten werden als erklärende Variablen in der Regression verwendet. Jede Hauptkomponente erfasst einen bestimmten Prozentsatz der Varianz der erklärenden Variablen, und dieser Parameter steuert den minimalen Prozentsatz der Varianz, die von den Hauptkomponenten jedes lokalen Modells erfasst werden muss. Wird beispielsweise der Wert 75 angegeben, verwendet die Software die Mindestanzahl der Hauptkomponenten, die erforderlich ist, um mindestens 75 Prozent der Varianz der erklärenden Variablen zu erfassen.

Es bestehen keine Korrelationen unter den Hauptkomponenten, sodass die Verwendung von Hauptkomponenten das Problem der Multikollinearität (erklärende Variablen, die miteinander korrelieren) löst. Die meisten in den erklärenden Variablen enthaltenen Informationen können häufig in nur wenigen Hauptkomponenten erfasst werden. Indem Sie die am wenigsten nützlichen Hauptkomponenten verwerfen, wird die Modellberechnung stabiler und effizienter, ohne dass die Genauigkeit signifikant abnimmt.

Um Hauptkomponenten zu berechnen, müssen die erklärenden Variablen eine Variabilität aufweisen. Wenn also eines Ihrer Eingabe-Raster der erklärenden Variablen konstante Werte innerhalb einer Teilmenge enthält, werden diese konstanten Raster nicht zur Berechnung der Hauptkomponenten für diese Teilmenge verwendet. Wenn alle Raster aus erklärenden Variablen in einer Teilmenge konstante Werte enthalten, meldet die Ausgabe-Diagnose-Feature-Class, dass keine Hauptkomponenten verwendet wurden und dass sie null Prozent der Variabilität erfasst haben.

Double
Teilmengenpolygon-Features
(optional)

Polygon-Features, die definieren, wo die lokalen Modelle berechnet werden. Die Punkte in den Polygonen werden für die lokalen Modelle verwendet. Dieser Parameter ist nützlich, wenn Sie wissen, dass sich die Werte der abhängigen Variable nach bekannten Regionen ändern. Diese Polygone können zum Beispiel Verwaltungsbezirke des Gesundheitswesens darstellen, wenn sich die Gesundheitspolitik in verschiedenen Bezirken unterscheidet.

Sie können auch das Werkzeug Teilmengen-Polygone generieren verwenden, um Teilmengen-Polygone zu erstellen. Die mit diesem Werkzeug erstellten Polygone sind kompakt und nicht überlappend.

Feature Layer
Transformationstyp der abhängigen Variablen
(optional)

Die Art der Transformation, die auf die Eingabedaten angewendet wird.

  • KeineEs wird keine Transformation angewendet. Dies ist die Standardeinstellung.
  • EmpiricalTransformation durch multiplikatives Verzerren mit der Basisfunktion "Empirical".
  • Log EmpiricalTransformation durch multiplikatives Verzerren mit der Basisfunktion "Log Empirical". Alle Datenwerte müssen positiv sein. Bei Auswahl dieser Option sind alle Vorhersagen positiv.
String
Semivariogramm-Modelltyp
(optional)

Das Semivariogramm-Modell, das für die Interpolation verwendet wird.

  • ExponentiellExponentielles Semivariogramm
  • NuggetNugget-Semivariogramm
  • WhittleWhittle-Semivariogramm
  • K-BesselK-Bessel-Semivariogramm
String
Maximale Anzahl Punkte in jedem lokalen Modell
(optional)

Die Eingabedaten werden automatisch in Teilmengen unterteilt, die nicht mehr als diese Anzahl von Punkten enthalten. Werden Teilmengenpolygon-Features angegeben, wird der Wert dieses Parameters ignoriert.

Long
Faktor der Überlappung von Bereichen zwischen lokalen Modellen
(optional)

Ein Faktor, der den Grad der Überlappung zwischen lokalen Modellen (auch Teilmengen genannt) angibt. Jeder Eingabepunkt kann mehreren Teilmengen angehören, und der Überlappungsfaktor gibt die durchschnittliche Anzahl von Teilmengen an, zu denen jeder Punkt gehört. Mit einem hohen Wert für den Überlappungsfaktor wird die Ausgabe-Oberfläche mehr geglättet, aber auch die Verarbeitungszeit verlängert. Die Werte müssen zwischen 1 und 5 liegen. Werden Teilmengenpolygon-Features angegeben, wird der Wert dieses Parameters ignoriert.

Double
Anzahl von Simulationen
(optional)

Die Anzahl der simulierten Semivariogramme in jedem lokalen Modell. Wenn mehr Simulationen verwendet werden, werden die Modellberechnungen stabiler, aber die Berechnungszeit ist auch länger.

Long
Suchnachbarschaft
(optional)

Definiert, welche umgebenden Punkte zum Steuern der Ausgabe verwendet werden sollen. Die Standardeinstellung lautet "Standard".

Standard: Kreisförmig

  • Maximale Anzahl von Nachbarn: Die maximale Anzahl von Nachbarn, die für Schätzung des Wertes an der unbekannten Position verwendet werden.
  • Minimale Anzahl von Nachbarn: Die minimale Anzahl von Nachbarn, die für Schätzung des Wertes an der unbekannten Position verwendet werden.
  • Sektortyp: Die Geometrie der Nachbarschaft.
    • Ein Sektor: Einzelne Ellipse.
    • Vier Sektoren: In vier Sektoren unterteilte Ellipse.
    • Vier Sektoren gedreht: In vier Sektoren unterteilte und um 45 Grad gedrehte Ellipse.
    • Acht Sektoren: In acht Sektoren unterteilte Ellipse.
  • Winkel: Der Rotationswinkel der Achse (Kreis) oder großen Halbachse (Ellipse) des beweglichen Fensters.
  • Radius: Die Länge des Radius des Suchkreises.

Glätten: Kreisförmig

  • Glättungsfaktor: Mit der Option "Nahtlose Interpolation" wird in einer Entfernung, die dem Produkt aus großer Halbachse und Glättungsfaktor entspricht, eine äußere und eine innere Ellipse erstellt. Die Punkte außerhalb der kleinen und innerhalb der großen Ellipse werden anhand einer Sigmoid-Funktion mit einem Wert zwischen Null und Eins gewichtet.
  • Radius: Die Länge des Radius des Suchkreises.
Geostatistical Search Neighborhood

arcpy.ga.EBKRegressionPrediction(in_features, dependent_field, in_explanatory_rasters, out_ga_layer, {out_raster}, {out_diagnostic_feature_class}, {measurement_error_field}, {min_cumulative_variance}, {in_subset_features}, {transformation_type}, {semivariogram_model_type}, {max_local_points}, {overlap_factor}, {number_simulations}, {search_neighborhood})
NameErläuterungDatentyp
in_features

Die Eingabe-Punkt-Features mit dem Feld, das interpoliert wird.

Feature Layer
dependent_field

Das Feld der Eingabe-Features der abhängigen Variablen, das die Werte der abhängigen Variablen enthält. Dies ist das Feld, das interpoliert wird.

Field
in_explanatory_rasters
[[in_explanatory_raster,…],...]

Eingabe-Raster, die die erklärenden Variablen darstellen, die zum Erstellen des Regressionsmodells verwendet werden. Diese Raster sollten Variablen darstellen, die bekanntermaßen die Werte der abhängigen Variable beeinflussen. Wenn beispielsweise Temperaturdaten interpoliert werden, sollte ein Höhenraster als erklärende Variable verwendet werden, da die Temperatur von der Höhe beeinflusst wird. Sie können bis zu 62 erklärende Raster verwenden.

Raster Layer; Mosaic Layer
out_ga_layer

Der geostatistische Ausgabe-Layer, in dem das Ergebnis der Interpolation angezeigt wird.

Geostatistical Layer
out_raster
(optional)

Das Ausgabe-Raster, in dem das Ergebnis der Interpolation angezeigt wird. Die Standardzellengröße ist das Maximum der Zellengrößen der Eingabe-Raster der erklärenden Variablen. Um eine andere Zellengröße zu verwenden, nutzen Sie die Umgebungseinstellung Zellengröße.

Raster Dataset
out_diagnostic_feature_class
(optional)

Ausgabe-Polygon-Feature-Class, die die Regionen jedes lokalen Modells anzeigt und Felder mit Diagnoseinformationen für die lokalen Modelle enthält. Für jede Teilmenge wird ein Polygon erstellt, das die Punkte in der Teilmenge umgibt, sodass Sie direkt erkennen können, welche Punkte in den einzelnen Teilmengen verwendet werden. Gibt es z. B. 10 lokale Modelle, umfasst die Ausgabe 10 Polygone. Die Feature-Class enthält die folgenden Felder:

  • Anzahl der Hauptkomponenten (PrincComps): Die Anzahl der Hauptkomponenten, die als erklärende Variablen verwendet wurden. Der Wert ist immer kleiner als oder gleich der Anzahl an Rastern aus erklärenden Variablen.
  • Prozentsatz der Varianz (PercVar): Die prozentuale Varianz, die von den Hauptkomponenten erfasst wird. Dieser Wert ist größer als oder gleich dem Wert, der für den unten stehenden Parameter Minimaler kumulativer Prozentsatz der Varianz angegeben wird.
  • Root Mean Square Error (RMSE): Die Quadratwurzel der durchschnittlichen quadrierten Kreuzvalidierungsfehler. Je kleiner dieser Wert ist, desto besser passt das Modell.
  • Prozent im 90-%-Intervall (Perc90): Der Prozentsatz der Datenpunkte, die in einem 90-prozentigen Konfidenzintervall der Kreuzvalidierung liegen. Dieser Wert sollte im Idealfall ungefähr 90 betragen. Liegt der Wert deutlich unter 90, bedeutet dies, dass die Standardfehler als zu gering geschätzt wurden. Liegt der Wert deutlich über 90, bedeutet dies, dass die Standardfehler als zu hoch geschätzt wurden.
  • Prozent im 95-%-Intervall (Perc95): Der Prozentsatz der Datenpunkte, die in einem 95-prozentigen Konfidenzintervall der Kreuzvalidierung liegen. Dieser Wert sollte im Idealfall ungefähr 95 betragen. Liegt der Wert deutlich unter 95, bedeutet dies, dass die Standardfehler als zu gering geschätzt wurden. Liegt der Wert deutlich über 95, bedeutet dies, dass die Standardfehler als zu hoch geschätzt wurden.
  • Mean Absolute Error (MeanAbsErr): Der Durchschnitt der absoluten Werte der Kreuzvalidierungsfehler. Dieser Wert sollte so klein wie möglich sein. Der Wert ähnelt dem Root Mean Square Error, wird jedoch weniger stark durch Extremwerte beeinflusst.
  • Mean Error (MeanError): Der Mittelwert der Kreuzvalidierungsfehler. Dieser Wert sollte gegen null gehen. Ein Wert, der deutlich von Null abweicht, weist darauf hin, dass die Vorhersagen verzerrt sind.
  • Continuous Ranked Probability Score (CRPS): Der CRPS ist ein Diagnoseinstrument, das die Abweichung von der prädiktiven kumulativen Verteilungsfunktion zu jedem beobachteten Datenwert misst. Dieser Wert sollte so klein wie möglich sein. Dieses Diagnoseinstrument hat Vorteile gegenüber Diagnoseinstrumenten für Kreuzvalidierungen, da es die Daten mit einer vollständigen Verteilung anstatt mit Einzelpunktvorhersagen vergleicht.
Feature Class
measurement_error_field
(optional)

Ein Feld, das den Messfehler für jeden Punkt in den Features der abhängigen Variablen angibt. Für jeden Punkt sollte der Wert dieses Feldes einer Standardabweichung des gemessenen Wertes des Punktes entsprechen. Verwenden Sie dieses Feld, wenn die Messfehlerwerte nicht an jedem Punkt gleich sind.

Eine häufige Quelle nicht konstanter Messfehler ist, dass die Daten mit unterschiedlichen Geräten gemessen werden. Die Geräte können unterschiedlich genau sein und daher unterschiedliche Messfehler erzeugen. Beispiel: Ein Thermometer rundet auf das nächste ganze Grad, ein anderes rundet auf das nächste Zehntelgrad. Die Variabilität der Messwerte wird oft vom Hersteller des Messgeräts angegeben oder ist aus der empirischen Praxis bekannt.

Lassen Sie diesen Parameter leer, wenn es keine Messfehlerwerte gibt oder die Messfehlerwerte unbekannt sind.

Field
min_cumulative_variance
(optional)

Definiert den minimalen kumulativen Prozentsatz der Varianz von Hauptkomponenten der Raster aus erklärenden Variablen. Vor dem Erstellen des Regressionsmodells werden die Hauptkomponenten der erklärenden Variablen berechnet, und diese Hauptkomponenten werden als erklärende Variablen in der Regression verwendet. Jede Hauptkomponente erfasst einen bestimmten Prozentsatz der Varianz der erklärenden Variablen, und dieser Parameter steuert den minimalen Prozentsatz der Varianz, die von den Hauptkomponenten jedes lokalen Modells erfasst werden muss. Wird beispielsweise der Wert 75 angegeben, verwendet die Software die Mindestanzahl der Hauptkomponenten, die erforderlich ist, um mindestens 75 Prozent der Varianz der erklärenden Variablen zu erfassen.

Es bestehen keine Korrelationen unter den Hauptkomponenten, sodass die Verwendung von Hauptkomponenten das Problem der Multikollinearität (erklärende Variablen, die miteinander korrelieren) löst. Die meisten in den erklärenden Variablen enthaltenen Informationen können häufig in nur wenigen Hauptkomponenten erfasst werden. Indem Sie die am wenigsten nützlichen Hauptkomponenten verwerfen, wird die Modellberechnung stabiler und effizienter, ohne dass die Genauigkeit signifikant abnimmt.

Um Hauptkomponenten zu berechnen, müssen die erklärenden Variablen eine Variabilität aufweisen. Wenn also eines Ihrer Eingabe-Raster der erklärenden Variablen konstante Werte innerhalb einer Teilmenge enthält, werden diese konstanten Raster nicht zur Berechnung der Hauptkomponenten für diese Teilmenge verwendet. Wenn alle Raster aus erklärenden Variablen in einer Teilmenge konstante Werte enthalten, meldet die Ausgabe-Diagnose-Feature-Class, dass keine Hauptkomponenten verwendet wurden und dass sie null Prozent der Variabilität erfasst haben.

Double
in_subset_features
(optional)

Polygon-Features, die definieren, wo die lokalen Modelle berechnet werden. Die Punkte in den Polygonen werden für die lokalen Modelle verwendet. Dieser Parameter ist nützlich, wenn Sie wissen, dass sich die Werte der abhängigen Variable nach bekannten Regionen ändern. Diese Polygone können zum Beispiel Verwaltungsbezirke des Gesundheitswesens darstellen, wenn sich die Gesundheitspolitik in verschiedenen Bezirken unterscheidet.

Sie können auch das Werkzeug Teilmengen-Polygone generieren verwenden, um Teilmengen-Polygone zu erstellen. Die mit diesem Werkzeug erstellten Polygone sind kompakt und nicht überlappend.

Feature Layer
transformation_type
(optional)

Die Art der Transformation, die auf die Eingabedaten angewendet wird.

  • NONEEs wird keine Transformation angewendet. Dies ist die Standardeinstellung.
  • EMPIRICALTransformation durch multiplikatives Verzerren mit der Basisfunktion "Empirical".
  • LOGEMPIRICALTransformation durch multiplikatives Verzerren mit der Basisfunktion "Log Empirical". Alle Datenwerte müssen positiv sein. Bei Auswahl dieser Option sind alle Vorhersagen positiv.
String
semivariogram_model_type
(optional)

Das Semivariogramm-Modell, das für die Interpolation verwendet wird.

Weitere Informationen zu den Semivariogramm-Modellen in der Regressionsvorhersage mit EBK

  • EXPONENTIALExponentielles Semivariogramm
  • NUGGETNugget-Semivariogramm
  • WHITTLEWhittle-Semivariogramm
  • K_BESSELK-Bessel-Semivariogramm
String
max_local_points
(optional)

Die Eingabedaten werden automatisch in Teilmengen unterteilt, die nicht mehr als diese Anzahl von Punkten enthalten. Werden Teilmengenpolygon-Features angegeben, wird der Wert dieses Parameters ignoriert.

Long
overlap_factor
(optional)

Ein Faktor, der den Grad der Überlappung zwischen lokalen Modellen (auch Teilmengen genannt) angibt. Jeder Eingabepunkt kann mehreren Teilmengen angehören, und der Überlappungsfaktor gibt die durchschnittliche Anzahl von Teilmengen an, zu denen jeder Punkt gehört. Mit einem hohen Wert für den Überlappungsfaktor wird die Ausgabe-Oberfläche mehr geglättet, aber auch die Verarbeitungszeit verlängert. Die Werte müssen zwischen 1 und 5 liegen. Werden Teilmengenpolygon-Features angegeben, wird der Wert dieses Parameters ignoriert.

Double
number_simulations
(optional)

Die Anzahl der simulierten Semivariogramme in jedem lokalen Modell. Wenn mehr Simulationen verwendet werden, werden die Modellberechnungen stabiler, aber die Berechnungszeit ist auch länger.

Long
search_neighborhood
(optional)

Definiert, welche umgebenden Punkte zum Steuern der Ausgabe verwendet werden sollen. Die Standardeinstellung lautet "Standard".

Es gibt folgende Suchnachbarschaftsklassen: SearchNeighborhoodStandardCircular und SearchNeighborhoodSmoothCircular.

Standard: Kreisförmig

  • radius: Die Länge des Radius des Suchkreises.
  • angle: Der Rotationswinkel der Achse (Kreis) oder großen Halbachse (Ellipse) des beweglichen Fensters.
  • nbrMax: Die maximale Anzahl der Nachbarn, die zum Schätzen des Wertes an der unbekannten Position verwendet werden sollen.
  • nbrMin: die minimale Anzahl der Nachbarn, die zum Schätzen des Wertes an der unbekannten Position verwendet werden sollen.
  • sectorType: Die Geometrie der Nachbarschaft.
    • ONE_SECTOR: Einzelne Ellipse.
    • FOUR_SECTORS: In vier Sektoren unterteilte Ellipse.
    • FOUR_SECTORS_SHIFTED: In vier Sektoren unterteilte und um 45 Grad gedrehte Ellipse.
    • EIGHT_SECTORS: In acht Sektoren unterteilte Ellipse.

Glätten: Kreisförmig

  • radius: Die Länge des Radius des Suchkreises.
  • smoothFactor: Mit der Option "Nahtlose Interpolation" wird in einer Entfernung, die dem Produkt aus großer Halbachse und Glättungsfaktor entspricht, eine äußere und eine innere Ellipse erstellt. Die Punkte außerhalb der kleinen und innerhalb der großen Ellipse werden anhand einer Sigmoid-Funktion mit einem Wert zwischen Null und Eins gewichtet.
Geostatistical Search Neighborhood

Codebeispiel

EBKRegressionPrediction – Beispiel 1 (Python-Fenster)

Eine Point-Feature-Class wird mithilfe von Rastern aus erklärenden Variablen interpoliert.

import arcpy
arcpy.EBKRegressionPrediction_ga("HousingSales_Points", "SalePrice",
                ["AREASQFEET", "NUMBATHROOMS", "NUMBEDROOMS","TOTALROOMS"],
                "out_ga_layer", None, None, None, 95, None, "LOGEMPIRICAL",
                "EXPONENTIAL", 100, 1, 100, None)
EBKRegressionPrediction – Beispiel 2 (eigenständiges Skript)

Eine Point-Feature-Class wird mithilfe von Rastern aus erklärenden Variablen interpoliert.

# Name: EBKRegressionPrediction_Example_02.py
# Description: Interpolates housing prices using EBK Regression Prediction
# Requirements: Geostatistical Analyst Extension
# Author: Esri

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/gaexamples/data.gdb"

# Set local variables
inDepFeatures = "HousingSales_Points"
inDepField = "SalePrice"
inExplanRasters = ["AREASQFEET", "NUMBATHROOMS", "NUMBEDROOMS","TOTALROOMS"]
outLayer = "outEBKRP_layer"
outRaster = "outEBKRP_raster"
outDiagFeatures = "outEBKRP_features"
inDepMeField = ""
minCumVariance = 97.5
outSubsetFeatures = ""
depTransform = ""
semiVariogram= "K_BESSEL"
maxLocalPoints = 50
overlapFactor = 1
numberSinulations = 200
radius = 100000
searchNeighbourhood = arcpy.SearchNeighborhoodStandardCircular(radius)

# Check out the ArcGIS Geostatistical Analyst extension license
arcpy.CheckOutExtension("GeoStats")

# Execute EBKRegressionPrediction
arcpy.EBKRegressionPrediction_ga(inDepFeatures, inDepField, inExplanRasters,
                outLayer, outRaster, outDiagFeatures, inDepMeField, minCumVariance,
                outSubsetFeatures, depTransform, semiVariogram, maxLocalPoints,
                overlapFactor, numberSinulations, searchNeighbourhood)

Lizenzinformationen

  • Basic: Erfordert Geostatistical Analyst
  • Standard: Erfordert Geostatistical Analyst
  • Advanced: Erfordert Geostatistical Analyst

Verwandte Themen