Beschriftung | Erläuterung | Datentyp |
Eingabe-Features der abhängigen Variablen | Die Eingabe-Punkt-Features mit dem Feld, das interpoliert wird. | Feature Layer |
Feld der abhängigen Variablen | Das Feld der Eingabe-Features der abhängigen Variablen, das die Werte der abhängigen Variablen enthält. Dies ist das Feld, das interpoliert wird. | Field |
Eingabe-Raster der erklärenden Variablen | Eingabe-Raster, die die erklärenden Variablen darstellen, die zum Erstellen des Regressionsmodells verwendet werden. Diese Raster sollten Variablen darstellen, die bekanntermaßen die Werte der abhängigen Variable beeinflussen. Wenn beispielsweise Temperaturdaten interpoliert werden, sollte ein Höhenraster als erklärende Variable verwendet werden, da die Temperatur von der Höhe beeinflusst wird. Sie können bis zu 62 erklärende Raster verwenden. | Raster Layer; Mosaic Layer |
Geostatistischer Ausgabe-Layer | Der geostatistische Ausgabe-Layer, in dem das Ergebnis der Interpolation angezeigt wird. | Geostatistical Layer |
Ausgabe-Vorhersage-Raster (optional) | Das Ausgabe-Raster, in dem das Ergebnis der Interpolation angezeigt wird. Die Standardzellengröße ist das Maximum der Zellengrößen der Eingabe-Raster der erklärenden Variablen. Um eine andere Zellengröße zu verwenden, nutzen Sie die Umgebungseinstellung Zellengröße. | Raster Dataset |
Ausgabe-Diagnose-Feature-Class (optional) | Ausgabe-Polygon-Feature-Class, die die Regionen jedes lokalen Modells anzeigt und Felder mit Diagnoseinformationen für die lokalen Modelle enthält. Für jede Teilmenge wird ein Polygon erstellt, das die Punkte in der Teilmenge umgibt, sodass Sie direkt erkennen können, welche Punkte in den einzelnen Teilmengen verwendet werden. Gibt es z. B. 10 lokale Modelle, umfasst die Ausgabe 10 Polygone. Die Feature-Class enthält die folgenden Felder:
| Feature Class |
Messwertfehler der abhängigen Variablen (optional) | Ein Feld, das den Messfehler für jeden Punkt in den Features der abhängigen Variablen angibt. Für jeden Punkt sollte der Wert dieses Feldes einer Standardabweichung des gemessenen Wertes des Punktes entsprechen. Verwenden Sie dieses Feld, wenn die Messfehlerwerte nicht an jedem Punkt gleich sind. Eine häufige Quelle nicht konstanter Messfehler ist, dass die Daten mit unterschiedlichen Geräten gemessen werden. Die Geräte können unterschiedlich genau sein und daher unterschiedliche Messfehler erzeugen. Beispiel: Ein Thermometer rundet auf das nächste ganze Grad, ein anderes rundet auf das nächste Zehntelgrad. Die Variabilität der Messwerte wird oft vom Hersteller des Messgeräts angegeben oder ist aus der empirischen Praxis bekannt. Lassen Sie diesen Parameter leer, wenn es keine Messfehlerwerte gibt oder die Messfehlerwerte unbekannt sind. | Field |
Minimaler kumulativer Prozentsatz der Varianz (optional) | Definiert den minimalen kumulativen Prozentsatz der Varianz von Hauptkomponenten der Raster aus erklärenden Variablen. Vor dem Erstellen des Regressionsmodells werden die Hauptkomponenten der erklärenden Variablen berechnet, und diese Hauptkomponenten werden als erklärende Variablen in der Regression verwendet. Jede Hauptkomponente erfasst einen bestimmten Prozentsatz der Varianz der erklärenden Variablen, und dieser Parameter steuert den minimalen Prozentsatz der Varianz, die von den Hauptkomponenten jedes lokalen Modells erfasst werden muss. Wird beispielsweise der Wert 75 angegeben, verwendet die Software die Mindestanzahl der Hauptkomponenten, die erforderlich ist, um mindestens 75 Prozent der Varianz der erklärenden Variablen zu erfassen. Es bestehen keine Korrelationen unter den Hauptkomponenten, sodass die Verwendung von Hauptkomponenten das Problem der Multikollinearität (erklärende Variablen, die miteinander korrelieren) löst. Die meisten in den erklärenden Variablen enthaltenen Informationen können häufig in nur wenigen Hauptkomponenten erfasst werden. Indem Sie die am wenigsten nützlichen Hauptkomponenten verwerfen, wird die Modellberechnung stabiler und effizienter, ohne dass die Genauigkeit signifikant abnimmt. Um Hauptkomponenten zu berechnen, müssen die erklärenden Variablen eine Variabilität aufweisen. Wenn also eines Ihrer Eingabe-Raster der erklärenden Variablen konstante Werte innerhalb einer Teilmenge enthält, werden diese konstanten Raster nicht zur Berechnung der Hauptkomponenten für diese Teilmenge verwendet. Wenn alle Raster aus erklärenden Variablen in einer Teilmenge konstante Werte enthalten, meldet die Ausgabe-Diagnose-Feature-Class, dass keine Hauptkomponenten verwendet wurden und dass sie null Prozent der Variabilität erfasst haben. | Double |
Teilmengenpolygon-Features (optional) | Polygon-Features, die definieren, wo die lokalen Modelle berechnet werden. Die Punkte in den Polygonen werden für die lokalen Modelle verwendet. Dieser Parameter ist nützlich, wenn Sie wissen, dass sich die Werte der abhängigen Variable nach bekannten Regionen ändern. Diese Polygone können zum Beispiel Verwaltungsbezirke des Gesundheitswesens darstellen, wenn sich die Gesundheitspolitik in verschiedenen Bezirken unterscheidet. Sie können auch das Werkzeug Teilmengen-Polygone generieren verwenden, um Teilmengen-Polygone zu erstellen. Die mit diesem Werkzeug erstellten Polygone sind kompakt und nicht überlappend. | Feature Layer |
Transformationstyp der abhängigen Variablen (optional) | Die Art der Transformation, die auf die Eingabedaten angewendet wird.
| String |
Semivariogramm-Modelltyp (optional) | Das Semivariogramm-Modell, das für die Interpolation verwendet wird.
| String |
Maximale Anzahl Punkte in jedem lokalen Modell (optional) | Die Eingabedaten werden automatisch in Teilmengen unterteilt, die nicht mehr als diese Anzahl von Punkten enthalten. Werden Teilmengenpolygon-Features angegeben, wird der Wert dieses Parameters ignoriert. | Long |
Faktor der Überlappung von Bereichen zwischen lokalen Modellen (optional) | Ein Faktor, der den Grad der Überlappung zwischen lokalen Modellen (auch Teilmengen genannt) angibt. Jeder Eingabepunkt kann mehreren Teilmengen angehören, und der Überlappungsfaktor gibt die durchschnittliche Anzahl von Teilmengen an, zu denen jeder Punkt gehört. Mit einem hohen Wert für den Überlappungsfaktor wird die Ausgabe-Oberfläche mehr geglättet, aber auch die Verarbeitungszeit verlängert. Die Werte müssen zwischen 1 und 5 liegen. Werden Teilmengenpolygon-Features angegeben, wird der Wert dieses Parameters ignoriert. | Double |
Anzahl von Simulationen (optional) | Die Anzahl der simulierten Semivariogramme in jedem lokalen Modell. Wenn mehr Simulationen verwendet werden, werden die Modellberechnungen stabiler, aber die Berechnungszeit ist auch länger. | Long |
Suchnachbarschaft (optional) | Definiert, welche umgebenden Punkte zum Steuern der Ausgabe verwendet werden sollen. Die Standardeinstellung lautet "Standard". Standard: Kreisförmig
Glätten: Kreisförmig
| Geostatistical Search Neighborhood |
Mit der Geostatistical Analyst-Lizenz verfügbar.
Zusammenfassung
Die Regressionsvorhersage mit EBK ist eine geostatistische Interpolationsmethode, die Empirical Bayesian Kriging mit Rastern als erklärende Variablen verwendet, wobei von den Rastern bekannt ist, dass sie sich auf den Wert der zu interpolierenden Daten auswirken. Diese Methode kombiniert Kriging mit Regressionsanalysen, um Vorhersagen zu treffen, die genauer sind als jeweils mit Regression oder Kridging erzielte Vorhersagen.
Verwendung
Dieses Werkzeug unterstützt nur Vorhersagekarten-Ausgaben. Um Standardfehler-, Quantil- oder Wahrscheinlichkeitskarten zu erstellen, geben Sie einen geostatistischen Layer aus und wandeln ihn mit der Funktion GA-Layer in Raster in ein (oder mehrere) Raster um.
Diese Kriging-Methode funktioniert mit mäßig nichtstationären Eingabedaten.
Für diese Interpolationsmethode sind nur die Suchnachbarschaften Standard: Kreisförmig und Glätten: Kreisförmig zulässig.
Wenn eines Ihrer Eingabe-Raster der erklärenden Variablen viele NoData-Zellen enthält, kann der geostatistische Ausgabe-Layer möglicherweise nicht in der Karte visualisiert werden. Dies ist nicht weiter problematisch – die Berechnungen werden korrekt durchgeführt. Um die Ausgabe zu visualisieren, wandeln Sie Ihren geostatistischen Layer mit GA-Layer in Raster oder GA-Layer in Gitternetz in ein Raster um. Sie können ein Raster mit diesem Werkzeug auch direkt ausgeben, indem Sie den Parameter Ausgabe-Vorhersage-Raster verwenden.
Wenn sich die Eingabe-Features der abhängigen Variablen in einem geographischen Koordinatensystem befinden, werden alle Entfernungen anhand von Sehnenentfernungen berechnet. Weitere Informationen zu Sehnenentfernungen finden Sie im Abschnitt Entfernungsberechnungen für Daten in geographischen Koordinaten im Hilfethema "Was ist Empirical Bayesian Kriging?".
Parameter
arcpy.ga.EBKRegressionPrediction(in_features, dependent_field, in_explanatory_rasters, out_ga_layer, {out_raster}, {out_diagnostic_feature_class}, {measurement_error_field}, {min_cumulative_variance}, {in_subset_features}, {transformation_type}, {semivariogram_model_type}, {max_local_points}, {overlap_factor}, {number_simulations}, {search_neighborhood})
Name | Erläuterung | Datentyp |
in_features | Die Eingabe-Punkt-Features mit dem Feld, das interpoliert wird. | Feature Layer |
dependent_field | Das Feld der Eingabe-Features der abhängigen Variablen, das die Werte der abhängigen Variablen enthält. Dies ist das Feld, das interpoliert wird. | Field |
in_explanatory_rasters [[in_explanatory_raster,…],...] | Eingabe-Raster, die die erklärenden Variablen darstellen, die zum Erstellen des Regressionsmodells verwendet werden. Diese Raster sollten Variablen darstellen, die bekanntermaßen die Werte der abhängigen Variable beeinflussen. Wenn beispielsweise Temperaturdaten interpoliert werden, sollte ein Höhenraster als erklärende Variable verwendet werden, da die Temperatur von der Höhe beeinflusst wird. Sie können bis zu 62 erklärende Raster verwenden. | Raster Layer; Mosaic Layer |
out_ga_layer | Der geostatistische Ausgabe-Layer, in dem das Ergebnis der Interpolation angezeigt wird. | Geostatistical Layer |
out_raster (optional) | Das Ausgabe-Raster, in dem das Ergebnis der Interpolation angezeigt wird. Die Standardzellengröße ist das Maximum der Zellengrößen der Eingabe-Raster der erklärenden Variablen. Um eine andere Zellengröße zu verwenden, nutzen Sie die Umgebungseinstellung Zellengröße. | Raster Dataset |
out_diagnostic_feature_class (optional) | Ausgabe-Polygon-Feature-Class, die die Regionen jedes lokalen Modells anzeigt und Felder mit Diagnoseinformationen für die lokalen Modelle enthält. Für jede Teilmenge wird ein Polygon erstellt, das die Punkte in der Teilmenge umgibt, sodass Sie direkt erkennen können, welche Punkte in den einzelnen Teilmengen verwendet werden. Gibt es z. B. 10 lokale Modelle, umfasst die Ausgabe 10 Polygone. Die Feature-Class enthält die folgenden Felder:
| Feature Class |
measurement_error_field (optional) | Ein Feld, das den Messfehler für jeden Punkt in den Features der abhängigen Variablen angibt. Für jeden Punkt sollte der Wert dieses Feldes einer Standardabweichung des gemessenen Wertes des Punktes entsprechen. Verwenden Sie dieses Feld, wenn die Messfehlerwerte nicht an jedem Punkt gleich sind. Eine häufige Quelle nicht konstanter Messfehler ist, dass die Daten mit unterschiedlichen Geräten gemessen werden. Die Geräte können unterschiedlich genau sein und daher unterschiedliche Messfehler erzeugen. Beispiel: Ein Thermometer rundet auf das nächste ganze Grad, ein anderes rundet auf das nächste Zehntelgrad. Die Variabilität der Messwerte wird oft vom Hersteller des Messgeräts angegeben oder ist aus der empirischen Praxis bekannt. Lassen Sie diesen Parameter leer, wenn es keine Messfehlerwerte gibt oder die Messfehlerwerte unbekannt sind. | Field |
min_cumulative_variance (optional) | Definiert den minimalen kumulativen Prozentsatz der Varianz von Hauptkomponenten der Raster aus erklärenden Variablen. Vor dem Erstellen des Regressionsmodells werden die Hauptkomponenten der erklärenden Variablen berechnet, und diese Hauptkomponenten werden als erklärende Variablen in der Regression verwendet. Jede Hauptkomponente erfasst einen bestimmten Prozentsatz der Varianz der erklärenden Variablen, und dieser Parameter steuert den minimalen Prozentsatz der Varianz, die von den Hauptkomponenten jedes lokalen Modells erfasst werden muss. Wird beispielsweise der Wert 75 angegeben, verwendet die Software die Mindestanzahl der Hauptkomponenten, die erforderlich ist, um mindestens 75 Prozent der Varianz der erklärenden Variablen zu erfassen. Es bestehen keine Korrelationen unter den Hauptkomponenten, sodass die Verwendung von Hauptkomponenten das Problem der Multikollinearität (erklärende Variablen, die miteinander korrelieren) löst. Die meisten in den erklärenden Variablen enthaltenen Informationen können häufig in nur wenigen Hauptkomponenten erfasst werden. Indem Sie die am wenigsten nützlichen Hauptkomponenten verwerfen, wird die Modellberechnung stabiler und effizienter, ohne dass die Genauigkeit signifikant abnimmt. Um Hauptkomponenten zu berechnen, müssen die erklärenden Variablen eine Variabilität aufweisen. Wenn also eines Ihrer Eingabe-Raster der erklärenden Variablen konstante Werte innerhalb einer Teilmenge enthält, werden diese konstanten Raster nicht zur Berechnung der Hauptkomponenten für diese Teilmenge verwendet. Wenn alle Raster aus erklärenden Variablen in einer Teilmenge konstante Werte enthalten, meldet die Ausgabe-Diagnose-Feature-Class, dass keine Hauptkomponenten verwendet wurden und dass sie null Prozent der Variabilität erfasst haben. | Double |
in_subset_features (optional) | Polygon-Features, die definieren, wo die lokalen Modelle berechnet werden. Die Punkte in den Polygonen werden für die lokalen Modelle verwendet. Dieser Parameter ist nützlich, wenn Sie wissen, dass sich die Werte der abhängigen Variable nach bekannten Regionen ändern. Diese Polygone können zum Beispiel Verwaltungsbezirke des Gesundheitswesens darstellen, wenn sich die Gesundheitspolitik in verschiedenen Bezirken unterscheidet. Sie können auch das Werkzeug Teilmengen-Polygone generieren verwenden, um Teilmengen-Polygone zu erstellen. Die mit diesem Werkzeug erstellten Polygone sind kompakt und nicht überlappend. | Feature Layer |
transformation_type (optional) | Die Art der Transformation, die auf die Eingabedaten angewendet wird.
| String |
semivariogram_model_type (optional) | Das Semivariogramm-Modell, das für die Interpolation verwendet wird. Weitere Informationen zu den Semivariogramm-Modellen in der Regressionsvorhersage mit EBK
| String |
max_local_points (optional) | Die Eingabedaten werden automatisch in Teilmengen unterteilt, die nicht mehr als diese Anzahl von Punkten enthalten. Werden Teilmengenpolygon-Features angegeben, wird der Wert dieses Parameters ignoriert. | Long |
overlap_factor (optional) | Ein Faktor, der den Grad der Überlappung zwischen lokalen Modellen (auch Teilmengen genannt) angibt. Jeder Eingabepunkt kann mehreren Teilmengen angehören, und der Überlappungsfaktor gibt die durchschnittliche Anzahl von Teilmengen an, zu denen jeder Punkt gehört. Mit einem hohen Wert für den Überlappungsfaktor wird die Ausgabe-Oberfläche mehr geglättet, aber auch die Verarbeitungszeit verlängert. Die Werte müssen zwischen 1 und 5 liegen. Werden Teilmengenpolygon-Features angegeben, wird der Wert dieses Parameters ignoriert. | Double |
number_simulations (optional) | Die Anzahl der simulierten Semivariogramme in jedem lokalen Modell. Wenn mehr Simulationen verwendet werden, werden die Modellberechnungen stabiler, aber die Berechnungszeit ist auch länger. | Long |
search_neighborhood (optional) | Definiert, welche umgebenden Punkte zum Steuern der Ausgabe verwendet werden sollen. Die Standardeinstellung lautet "Standard". Es gibt folgende Suchnachbarschaftsklassen: SearchNeighborhoodStandardCircular und SearchNeighborhoodSmoothCircular. Standard: Kreisförmig
Glätten: Kreisförmig
| Geostatistical Search Neighborhood |
Codebeispiel
Eine Point-Feature-Class wird mithilfe von Rastern aus erklärenden Variablen interpoliert.
import arcpy
arcpy.EBKRegressionPrediction_ga("HousingSales_Points", "SalePrice",
["AREASQFEET", "NUMBATHROOMS", "NUMBEDROOMS","TOTALROOMS"],
"out_ga_layer", None, None, None, 95, None, "LOGEMPIRICAL",
"EXPONENTIAL", 100, 1, 100, None)
Eine Point-Feature-Class wird mithilfe von Rastern aus erklärenden Variablen interpoliert.
# Name: EBKRegressionPrediction_Example_02.py
# Description: Interpolates housing prices using EBK Regression Prediction
# Requirements: Geostatistical Analyst Extension
# Author: Esri
# Import system modules
import arcpy
# Set environment settings
arcpy.env.workspace = "C:/gaexamples/data.gdb"
# Set local variables
inDepFeatures = "HousingSales_Points"
inDepField = "SalePrice"
inExplanRasters = ["AREASQFEET", "NUMBATHROOMS", "NUMBEDROOMS","TOTALROOMS"]
outLayer = "outEBKRP_layer"
outRaster = "outEBKRP_raster"
outDiagFeatures = "outEBKRP_features"
inDepMeField = ""
minCumVariance = 97.5
outSubsetFeatures = ""
depTransform = ""
semiVariogram= "K_BESSEL"
maxLocalPoints = 50
overlapFactor = 1
numberSinulations = 200
radius = 100000
searchNeighbourhood = arcpy.SearchNeighborhoodStandardCircular(radius)
# Check out the ArcGIS Geostatistical Analyst extension license
arcpy.CheckOutExtension("GeoStats")
# Execute EBKRegressionPrediction
arcpy.EBKRegressionPrediction_ga(inDepFeatures, inDepField, inExplanRasters,
outLayer, outRaster, outDiagFeatures, inDepMeField, minCumVariance,
outSubsetFeatures, depTransform, semiVariogram, maxLocalPoints,
overlapFactor, numberSinulations, searchNeighbourhood)
Umgebungen
Lizenzinformationen
- Basic: Erfordert Geostatistical Analyst
- Standard: Erfordert Geostatistical Analyst
- Advanced: Erfordert Geostatistical Analyst