Erklärende Variablen für räumliche Komponenten erstellen (Spatial Statistics)—ArcGIS Pro

Zusammenfassung

Erstellt verschiedene Felder für räumliche Komponenten, die die räumlichen Muster von einem oder mehreren numerischen Feldern am besten beschreiben und als nützliche erklärende Variablen in einer Vorhersage oder einem Regressionsmodell dienen.

Bei den Eingabefeldern muss es sich um die erklärenden und abhängigen Variablen handeln, die in einem Vorhersagemodell verwendet werden. Die Ergebnisfelder für räumliche Komponenten (sogenannte Moran-Eigenvektoren) können – zusätzlich zu den ursprünglichen erklärenden Variablen – als erklärende Variablen dienen und bewirken oft eine Verbesserung der Vorhersagekraft des Modells, da räumliche Muster der anderen Variablen einbezogen werden.

Weitere Informationen zu Moran-Eigenvektoren

Abbildung

Verwendung

Das Werkzeug erstellt räumliche Komponenten, die die Werte der Eingabefelder am genauesten vorhersagen können. Jede Komponente stellt ein räumliches Muster dar, wobei die Komponenten ausgewählt werden, deren Muster den Mustern der Eingabefelder am meisten ähneln. Wenn ein Feld beispielsweise einen deutlichen Trend von Westen nach Osten aufweist, darüber hinaus jedoch auch kleine Cluster mit niedrigen und hohen Werten enthält, kann das Muster durch die Kombination von zwei Komponenten dargestellt werden: eine für den Trend von Westen nach Osten und eine andere für die Cluster. Durch das Einbeziehen erklärender Variablen, die den räumlichen Mustern der erklärenden und abhängigen Variablen ähneln, werden räumliche Effekte in Vorhersage- und Regressionswerkzeugen berücksichtigt, z. B. in den Werkzeugen Generalisierte lineare Regression und Forest-basierte und geboostete Klassifizierung und Regression. Aufgrund der Berücksichtigung räumlicher Effekte sind die Vorhersagen dieser nichträumlichen Vorhersagemodelle normalerweise genauer, und die räumliche Verzerrung (z. B. räumliche Muster in den Residuen) ist oft geringer. Dies ist wichtig, damit für bestimmte Bereiche nicht systematisch kleinere oder größere Werte vom Modell vorhergesagt werden. Darüber hinaus können die Koeffizienten der erklärenden Variablen einfacher interpretiert werden, da sie die direkte Beziehung zwischen der erklärenden Variable und der abhängigen Variable schätzen und dabei durch räumliche Effekte verursachtes Rauschen ausfiltern.
Dieses Werkzeug ist für die Erstellung erklärender Variablen zur Verwendung in Vorhersagemodellen vorgesehen. Das Werkzeug Räumliche Autokorrelation aus Feld filtern eignet sich jedoch ebenfalls für diesen Zweck, indem die räumliche Autokorrelation aus dem Feld "Residuum" oder "Standardisiertes Residuum" eines Vorhersagemodells entfernt wird. Die räumlichen Komponenten, mit denen die Autokorrelation von Residuen effektiv ausgefiltert wird, stellen häufig nützliche erklärende Variablen dar und können oft eine gleichwertige Modellverbesserung für dieses Werkzeug mit weniger Komponenten als erklärenden Variablen erzielen. Es empfiehlt sich, beide Werkzeuge zu testen und die Ergebnisse zu vergleichen, die sich durch das Einbeziehen räumlicher Komponenten aus den beiden Werkzeugen im ursprünglichen Vorhersagemodell ergeben (z. B. durch den Vergleich der Adjusted-R-Squared- oder AIC-Werte).
Die räumlichen Komponenten werden als Felder in der Ausgabe-Feature-Class zurückgegeben. Bei Ausführung des Werkzeugs in einer aktiven Karte wird der Ausgabe-Feature-Layer basierend auf der ersten räumlichen Komponente dargestellt. Die Eingabefelder werden auch in die Ausgabe-Feature-Class einbezogen, sodass die ursprünglichen erklärenden Variablen und die erklärenden Variablen der räumlichen Komponente verwendet werden können, um die abhängige Variable in Vorhersagewerkzeugen vorherzusagen, ohne die Eingabe- und Ausgabe-Feature-Classes zusammenführen zu müssen.
Die Geoverarbeitungsmeldungen enthalten die folgenden beiden Tabellen, in denen die Auswahl der räumlichen Komponenten zusammengefasst ist, die zum räumlichen Filtern des Eingabefeldes verwendet wird:
- Suchverlauf für Nachbarschaften: Für jede der 28 getesteten räumlichen Gewichtungsmatrizen (SWMs) werden Details der SWM (wie die Anzahl der Nachbarn und das Gewichtungsschema), der p-Wert und Adjusted-R-Squared-Wert bei Verwendung aller Komponenten, der Adjusted-R-Squared-Wert bei Verwendung nur der ausgewählten Komponenten und die Anzahl der ausgewählten Komponenten angezeigt. Die SWM mit dem höchsten Adjusted-R-Squared-Wert bei Verwendung der ausgewählten Komponenten wird zum Erstellen der Komponenten verwendet und durch fett formatierten Text und ein Sternchen gekennzeichnet.
- Suchverlauf für räumliche Komponenten: Für die ausgewählte SWM werden der ID-Wert der einzelnen Komponenten (ID 4 steht beispielsweise für die vierte räumliche Komponente), der Morans I-Wert und p-Wert der Komponente und der Adjusted-R-Squared-Wert der Komponente (einschließlich aller zuvor ausgewählten Komponenten) angezeigt. Die Zeilen sind nach den Komponenten, mit denen die Eingabefelder am effektivsten unabhängig vorhergesagt wurden (höchster R-Squared-Wert), geordnet.
Mit dem Werkzeug werden eine SWM für die Eingabe-Features (es sei denn, im Parameter Eingabe-Datei der räumlichen Gewichtungsmatrix wurde eine angegeben) sowie erklärende Variablen für Komponenten ausgewählt. Dabei wird wie folgt vorgegangen:
1. Die SWM aller 28 SWM-Kandidaten wird auf statistische Signifikanz getestet, indem mit allen räumlichen Komponenten als erklärenden Variablen statistisch signifikante Vorhersagen für die Eingabefelder getroffen werden. Für den Signifikanztest wird der kombinierte R-Squared-Wert aus allen Eingabefeldern verwendet und eine Šidák-Korrektur des p-Wertes durchgeführt, um die Anzahl der getesteten SWMs zu berücksichtigen. SWMs, die statistisch nicht signifikant sind, werden von der Kandidatenliste entfernt.
2. Für jeden verbleibenden SWM-Kandidaten werden räumliche Komponenten sequenziell als erklärende Variablen hinzugefügt, bis die nächste Komponente nicht für sich allein genommen statistisch signifikant ist (p-Wert größer als 0,05) oder der Adjusted-R-Squared-Wert der Komponente (und aller zuvor ausgewählten Komponenten) den Adjusted-R-Squared-Wert bei Verwendung aller Komponenten der SWM überschreitet. Jede neue Komponente wird ausgewählt, indem nach derjenigen mit der höchsten statistischen Signifikanz (niedrigster p-Wert) bei Verwendung zur Vorhersage der Eingabefelder gesucht wird.
3. Die SWM-Datei mit dem höchsten Adjusted-R-Squared-Wert wird als SWM-Endergebnis ausgewählt, und die zugehörigen ausgewählten räumlichen Komponenten werden als Felder in der Ausgabe-Feature-Class zurückgegeben.
Dieses Verfahren wird als FWD-Auswahlmethode (vorwärtsgerichtete Auswahl) bezeichnet und wird in der folgenden Quelle ausführlich beschrieben:
- Blanchet, F. Guillaume; Legendre, Pierre und Borcard, Daniel. 2008. "Forward selection of explanatory variables." Ecology 89, Nr. 9: 2623–2632. https://doi.org/10.1890/07-0986.1.
.

Parameter

Beschriftung	Erläuterung	Datentyp
Eingabe-Features	Die Eingabe-Features mit Feldern für die erklärenden und abhängigen Variablen, die in einem Vorhersagemodell verwendet werden.	Feature Layer
Eingabefelder	Die Eingabefelder für die erklärenden und abhängigen Variablen, die in einem Vorhersagemodell verwendet werden.	Field
Ausgabe-Features	Die Ausgabe-Features mit den Feldern der räumlichen Komponenten, die als zusätzliche erklärende Variablen in einem Vorhersagemodell verwendet werden können.	Feature Class
Alle Felder aus Eingabe-Features anhängen (optional)	Gibt an, ob alle Felder aus den Eingabe-Features in die Ausgabe-Feature-Class kopiert werden. Aktiviert: Alle Felder der Eingabe-Features werden in die Ausgabe-Feature-Class kopiert. Dies ist die Standardeinstellung. Deaktiviert: Nur die Eingabefelder werden in die Ausgabe-Feature-Class kopiert.	Boolean
Eingabe-Datei der räumlichen Gewichtungsmatrix (optional)	Die Eingabe-SWM-Datei (.swm). Wenn ein Wert angegeben wird, wird die Datei verwendet, um Nachbarn und Gewichtungen der Eingabe-Features zu definieren. Wenn kein Wert angegeben wird, testet das Werkzeug 28 verschiedene Nachbarschaften und verwendet diejenige, mit der Komponenten erstellt werden, die sich am effektivsten als erklärende Variablen einsetzen lassen.	File
Ausgabe-Datei der räumlichen Gewichtungsmatrix (optional)	Die Ausgabe-SWM-Datei (.swm) der Nachbarn und Gewichtungen, die vom Werkzeug ausgewählt wurden. Dieser Parameter wird nicht angewendet, wenn Sie eine Eingabe-.swm-Datei angeben.	File
Eindeutiges ID-Feld (optional)	Das Feld für die eindeutige ID der Ausgabe-.swm-Datei. Das Feld muss für jedes Eingabe-Feature einen Einzelwert in Form einer ganzen Zahl enthalten.	Field

arcpy.stats.CreateSpatialComponentExplanatoryVariables(in_features, input_fields, out_features, {append_all_fields}, {in_swm}, {out_swm}, {id_field})

Name	Erläuterung	Datentyp
in_features	Die Eingabe-Features mit Feldern für die erklärenden und abhängigen Variablen, die in einem Vorhersagemodell verwendet werden.	Feature Layer
input_fields [input_fields,...]	Die Eingabefelder für die erklärenden und abhängigen Variablen, die in einem Vorhersagemodell verwendet werden.	Field
out_features	Die Ausgabe-Features mit den Feldern der räumlichen Komponenten, die als zusätzliche erklärende Variablen in einem Vorhersagemodell verwendet werden können.	Feature Class
append_all_fields (optional)	Gibt an, ob alle Felder aus den Eingabe-Features in die Ausgabe-Feature-Class kopiert werden. ALL—Alle Felder der Eingabe-Features werden in die Ausgabe-Feature-Class kopiert. Dies ist die Standardeinstellung. NO_FIELDS—Nur die Eingabefelder werden in die Ausgabe-Feature-Class kopiert.	Boolean
in_swm (optional)	Die Eingabe-SWM-Datei (.swm). Wenn ein Wert angegeben wird, wird die Datei verwendet, um Nachbarn und Gewichtungen der Eingabe-Features zu definieren. Wenn kein Wert angegeben wird, testet das Werkzeug 28 verschiedene Nachbarschaften und verwendet diejenige, mit der Komponenten erstellt werden, die sich am effektivsten als erklärende Variablen einsetzen lassen.	File
out_swm (optional)	Die Ausgabe-SWM-Datei (.swm) der Nachbarn und Gewichtungen, die vom Werkzeug ausgewählt wurden. Dieser Parameter wird nicht angewendet, wenn Sie eine Eingabe-.swm-Datei angeben.	File
id_field (optional)	Das Feld für die eindeutige ID der Ausgabe-.swm-Datei. Das Feld muss für jedes Eingabe-Feature einen Einzelwert in Form einer ganzen Zahl enthalten.	Field

Codebeispiel

CreateSpatialComponentExplanatoryVariables: Beispiel 1 (Python-Fenster)

Das folgende Skript im Python-Fenster veranschaulicht, wie Sie die Funktion CreateSpatialComponentExplanatoryVariables verwenden.

# Create fields that describe the spatial patterns of POPULATION.

arcpy.env.workspace = r"c:\data\project_data.gdb"

arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="states",
    input_fields="POPULATION",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

CreateSpatialComponentExplanatoryVariables: Beispiel 2 (eigenständiges Skript)

Das folgende eigenständige Skript veranschaulicht, wie die Funktion CreateSpatialComponentExplanatoryVariables verwendet wird.

# Create fields that describe the spatial patterns of two analysis fields.

import arcpy

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"

# Run the tool.
arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="myFeatureClass",
    input_fields="myAnalysisField1;myAnalysis Field2",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

# Print the messages. 
print(arcpy.GetMessages())

Umgebungen

Geographische Transformationen, Ausgabe-Koordinatensystem, Faktor für parallele Verarbeitung, Zufallszahlengenerator

Lizenzinformationen

Basic: Ja
Standard: Ja
Advanced: Ja