Geographisch gewichtete Regression (GWR) (GeoAnalytics)

Zusammenfassung

Führt eine geographisch gewichtete Regression (GWR) durch. Dies ist eine lokale Form der linearen Regression zur Modellierung räumlich variierender Beziehungen.

Vorversion:

Die Erweiterung ArcGIS GeoAnalytics Server wird in ArcGIS Enterprise abgekündigt. Die letzte Version von GeoAnalytics Server ist in ArcGIS Enterprise 11.3 enthalten. Dieses Geoverarbeitungswerkzeug steht in ArcGIS Enterprise 11.3 und früheren Versionen zur Verfügung.

Hinweis:

Dieses Werkzeug ergänzt den Funktionsumfang des Werkzeugs Geographisch gewichtete Regression (GWR), das in ArcGIS Pro 2.3 eingeführt wurde.

Die Algorithmen des Werkzeugs werden unter Funktionsweise der geographisch gewichteten Regression (GWR) näher erläutert. Dieses Thema beschreibt das Werkzeug der Toolbox "Spatial Statistics". Zurzeit sind nicht alle Funktionen im Werkzeug der Toolbox "GeoAnalytics Server" enthalten.

Verwendung

  • Dieses Geoverarbeitungswerkzeug ist ab ArcGIS Enterprise 10.8.1 verfügbar.

  • Dieses Werkzeug führt eine geographisch gewichtete Regression (GWR) durch, eine lokale Form von Regression zur Modellierung räumlich variierender Beziehungen. Das GWR-Werkzeug erstellt ein lokales Modell der Variable oder des Prozesses, die bzw. den Sie verstehen oder vorhersagen möchten, indem eine Regressionsgleichung an jedes Feature im Dataset angepasst wird. Das Werkzeug Geographisch gewichtete Regression (GWR) erstellt diese separaten Gleichungen durch Einbeziehung der abhängigen und erklärenden Variablen von Features in der Nachbarschaft der einzelnen Ziel-Features. Form und Ausdehnung jeder analysierten Nachbarschaft basieren auf den Eingaben für die Parameter Nachbarschaftstyp und Auswahlmethode für Nachbarschaften.

  • Wenden Sie das GWR-Werkzeug auf Datasets mit mehreren hundert Features an, um optimale Ergebnisse zu erzielen. Für kleine Datasets ist dieses Werkzeug nicht geeignet. Das Werkzeug funktioniert nicht mit Multipoint-Daten.

  • Dieses Werkzeug unterstützt keine Eingaben mit den Feldern "Nur Datum" oder "Nur Zeit".

  • Verwenden Sie den Parameter Eingabe-Features mit einem Feld, das das Phänomen darstellt, das Sie modellieren (die abhängige Variable), und einem oder mehreren Feldern, die die Parameterwerte Erklärende Variable(n) darstellen. Diese Felder müssen numerisch sein und einen Wertebereich aufweisen. Features, in deren abhängiger oder erklärender Variable Werte fehlen, werden aus der Analyse ausgeschlossen. Werte können mit dem Werkzeug Feld berechnen geändert werden. Wenn Ihre Daten zur Verwendung in ArcGIS Pro bereit sind, ergänzen Sie das Dataset mit dem Werkzeug Fehlende Werte ausfüllen um die fehlenden Werte, bevor Sie das Werkzeug Geographisch gewichtete Regression (GWR) ausführen.

  • Das Werkzeug Geographisch gewichtete Regression (GWR) erzeugt zudem Ausgabe-Features und fügt Felder hinzu, die lokale Diagnosewerte angeben. Die Parameterwerte Ausgabe-Features und verknüpfte Diagramme werden automatisch dem Inhaltsverzeichnis hinzugefügt, wobei ein Hot/Cold-Rendering-Schema zur Modellierung von Residuen angewendet wird. Eine vollständige Erläuterung der einzelnen Ausgaben finden Sie im Thema Funktionsweise des Werkzeugs "Geographisch gewichtete Regression (GWR)".

    Hinweis:

    Das Werkzeug Geographisch gewichtete Regression (GWR) erzeugt eine Vielzahl von Ausgaben. Während der Ausführung des Werkzeugs wird unten im Bereich Geoverarbeitung eine Zusammenfassung des GWR-Modells in Form einer Meldung angezeigt. Sie können auf diese Meldung zugreifen, indem Sie mit der Maus auf die Fortschrittsleiste zeigen, auf die Pop-out-Schaltfläche klicken oder den Abschnitt "Meldungen" im Bereich Geoverarbeitung erweitern. Sie können auch über den Geoverarbeitungsverlauf auf die Meldungen einer früheren Ausführung des Werkzeugs Geographisch gewichtete Regression (GWR) zugreifen.

  • Sie müssen projizierte Daten verwenden.

  • Es ist üblich, die Daten global mit dem Werkzeug Generalisierte lineare Regression zu erkunden, bevor Sie die Daten lokal mit dem Werkzeug Geographisch gewichtete Regression (GWR) erkunden.

  • Die Parameter Abhängige Variable und Erklärende Variable(n) müssen numerische Felder sein, die eine Vielzahl von Werten enthalten. Es sollte global und lokal eine Variation in diesen Werten geben. Verwenden Sie deshalb keine erklärenden "Dummy"-Variablen, um die verschiedenen räumlichen Ordnungen in Ihrem GWR-Modell darzustellen (z. B. Zuweisen des Wertes 1 zu Zählbezirken außerhalb des Stadtkerns, wenn allen anderen der Wert 0 zugewiesen wird). Da beim Werkzeug Geographisch gewichtete Regression (GWR) die erklärenden Variablenkoeffizienten variieren können, sind diese erklärenden Variablen für räumliche Ordnungen unnötig. Wenn sie einbezogen werden, können sie Probleme aufgrund von lokaler Multikollinearität verursachen.

  • In globalen Regressionsmodellen wie Generalisierte lineare Regression sind die Ergebnisse unzuverlässig, wenn zwei oder mehr Variablen Multikollinearität aufweisen (wenn zwei oder mehr Variablen redundant sind oder das Gleiche aussagen). Das Werkzeug Geographisch gewichtete Regression (GWR) erstellt eine lokale Regressionsgleichung für jedes Feature im Dataset. Wenn die Werte für eine bestimmte erklärende Variable zur räumlichen Cluster-Bildung neigen, liegen wahrscheinlich Probleme mit lokaler Multikollinearität vor. Das Feld für angepasste Bedingungswerte (COND_ADJ) in der Ausgabe-Feature-Class gibt an, wann Ergebnisse aufgrund von lokaler Multikollinearität instabil sind. Betrachten Sie im Allgemeinen Ergebnisse für Features mit einem angepassten Bedingungswert größer als 30, gleich null oder (für Shapefiles) gleich -1.7976931348623158e+308 skeptisch.

  • Bei Verwendung von Nominal- oder Kategoriedaten in einem GWR-Modell ist Vorsicht angebracht. Wenn Kategorien zur Bildung von räumlichen Clustern neigen, treten u. U. Probleme aufgrund von lokaler Multikollinearität auf. Der in der Ausgabe des GWR-Werkzeugs enthaltene angepasste Bedingungswert gibt an, wann lokale Kollinearität ein Problem darstellt (ein angepasster Bedingungswert kleiner als 0, größer als 30 oder gleich NULL). Bei einer starken lokalen Multikollinearität sind die Ergebnisse instabil.

  • Bei einem falsch angegebenen Regressionsmodell handelt es sich um ein Modell, in dem eine wichtige erklärende Variable fehlt. Die statistisch signifikante räumliche Autokorrelation in den Regressionsresiduen oder die unerwartete räumliche Variation unter den Koeffizienten einer oder mehrerer erklärender Variablen weist darauf hin, dass das Modell falsch angegeben ist. Ermitteln Sie mit allen verfügbaren Analysemethoden (zum Beispiel die Untersuchung von GLR-Residuen und GWR-Koeffizientenvariationen), welche wichtigen Variablen fehlen, und nehmen Sie diese in das Modell auf.

  • Hinterfragen Sie stets, ob es sinnvoll ist, dass eine erklärende Variable nicht stationär ist. Nehmen Sie beispielsweise an, Sie modellieren die Dichte einer bestimmten Pflanzenart als Funktion mehrerer Variablen einschließlich ASPECT. Wenn Sie feststellen, dass sich der Koeffizient für die Variable ASPECT über das Untersuchungsgebiet hinweg ändert, weist dies darauf hin, dass eine wichtige erklärende Variable fehlt (zum Beispiel die Verbreitung einer konkurrierenden Vegetationsart). Treffen Sie alle möglichen Maßnahmen, damit alle wichtigen erklärenden Variablen in Ihrem Regressionsmodell enthalten sind.

  • Wenn das Ergebnis einer Berechnung unendlich oder nicht definiert ist, lautet das Ergebnis für Nicht-Shapefiles NULL.

  • Schwerwiegende Probleme beim Modellentwurf oder Fehler mit der Meldung, dass die Anzahl an Nachbarn in lokalen Gleichungen nicht ausreicht, weisen oft auf globale oder lokale Multikollinearität hin. Um die Problemursache zu ermitteln, führen Sie ein globales Modell unter Verwendung des Werkzeugs Generalisierte lineare Regression aus, und untersuchen Sie den VIF-Wert für jede erklärende Variable. Wenn einige der VIF-Werte sehr groß sind (z. B. größer als 7,5), verhindert die globale Multikollinearität die Berechnung mit dem GWR-Werkzeug. Jedoch ist wahrscheinlich eher eine lokale Multikollinearität das Hauptproblem. Versuchen Sie, eine thematische Karte für jede erklärende Variable zu erstellen. Wenn die Karte räumliche Cluster-Bildung von identischen Werten erkennen lässt, entfernen Sie diese Variablen aus dem Modell oder kombinieren Sie diese Variablen mit anderen erklärenden Variablen, um die Wertvariation zu erhöhen. Wenn Sie beispielsweise Immobilienwerte modellieren und für Schlafzimmer wie auch Badezimmer über Variablen verfügen, ist es möglicherweise sinnvoll, diese zu kombinieren, um die Wertvariation zu erhöhen oder sie als kombinierte Größe darzustellen. Vermeiden Sie beim Erstellen von GWR-Modellen die Verwendung der folgenden Variablen: Dummy-Variablen für räumliche Ordnungen, Kategorievariablen bzw. nominale Variablen für räumliche Cluster-Bildung oder Variablen mit sehr wenigen möglichen Werten.

  • Geographisch gewichtete Regression ist ein lineares Modell, für das die gleichen Anforderungen wie für Generalisierte lineare Regression gelten. Prüfen Sie die in Funktionsweise des Werkzeugs "Geographisch gewichtete Regression (GWR)" erläuterte Diagnose, um sicherzustellen, dass Ihr GWR-Modell ordnungsgemäß festgelegt ist. Nicht alle beschriebenen Diagnosefunktionen sind in der Toolbox "GeoAnalytics Desktop" verfügbar. Der Abschnitt Wie Regressionsmodelle ungültig werden im Thema "Grundlagen zur Regressionsanalyse" bietet ebenfalls Informationen, um die Richtigkeit Ihres Modells sicherzustellen.

  • Mithilfe der folgenden Schritte können Sie die Performance des Werkzeugs Geographisch gewichtete Regression (GWR) verbessern:

    • Legen Sie die Ausdehnungsumgebung so fest, dass nur die gewünschten Daten analysiert werden.
    • Reduzieren Sie die Anzahl der Nachbarn in Ihrer Berechnung.
    • Verwenden Sie die Option Anzahl der Nachbarn statt der Option Entfernungsband im Parameter Nachbarschaftstyp (neighborhood_type = "NUMBER OF NEIGHBORS" in Python).
    • Verwenden Sie weniger erklärende Variablen, wenn möglich.
    • Verwenden Sie lokale Daten an der Stelle, an der die Analyse ausgeführt wird.

  • Dieses Geoverarbeitungswerkzeug wird unterstützt durch ArcGIS GeoAnalytics Server. Die Analyse wird auf dem GeoAnalytics Server ausgeführt, und die Ergebnisse werden in den eigenen Inhalten in ArcGIS Enterprise gespeichert.

  • Bei der Ausführung von GeoAnalytics Server-Werkzeugen wird die Analyse auf dem GeoAnalytics Server ausgeführt. Für eine optimale Performance sollten die Daten GeoAnalytics Server über Feature-Layer zur Verfügung stehen, die auf Ihrem ArcGIS Enterprise-Portal gehostet werden. Alternativ können Big-Data-Dateifreigaben verwendet werden. Daten, auf die GeoAnalytics Server nicht lokal zugreifen kann, werden vor Analysebeginn auf den GeoAnalytics Server verschoben. Dadurch dauert die Ausführung eines Werkzeugs länger. Es kann zudem vorkommen, dass das Verschieben der Daten von ArcGIS Pro zu GeoAnalytics Server fehlschlägt. Die Wahrscheinlichkeit eines Fehlers hängt dabei von der Netzwerkgeschwindigkeit sowie der Größe und Komplexität der Daten ab. Es wird empfohlen, dass Sie Ihre Daten stets freigeben oder eine Big-Data-Dateifreigabe erstellen.

    Weitere Informationen zum Freigeben von Daten in Ihrem Portal

    Weitere Informationen zum Erstellen einer Big-Data-Dateifreigabe über Server Manager

  • Eine ähnliche Analyse ist auch mit dem Werkzeug Geographisch gewichtete Regression möglich. Verwenden Sie das Werkzeug in der Toolbox "Spatial Statistics" für folgende Workflows:

    • Lokale Layer Ihres ArcGIS Pro-Computers verwenden (z. B. Feature-Classes in einer File-Geodatabase).
    • Anderen Layer vorhersagen oder Raster-Koeffizienten-Layer erstellen.
    • Binäre (logistische) Variable oder die Variable Anzahl (Poisson) modellieren.
    • Nachbarschaftssuche mit Golden Search oder manuellen Intervallen definieren.

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Features

Die Point-Feature-Class, die die abhängigen und erklärenden Variablen enthält.

Feature Set
Abhängige Variable

Das numerische Feld mit den beobachteten Werten, die modelliert werden.

Field
Modelltyp

Gibt den Typ der Daten an, die modelliert werden.

  • Kontinuierlich (Gauß)Der Wert für die abhängige Variable ist kontinuierlich. Das Gauß'sche Modell wird verwendet, und das Werkzeug führt eine Regression des Typs "Kleinste Quadrate" durch.
String
Erklärende Variable(n)

Eine Liste von Feldern, die unabhängige erklärende Variablen im Regressionsmodell darstellen.

Field
Ausgabe-Features

Der Name des Ausgabe-Feature-Service.

String
Nachbarschaftstyp

Gibt an, ob die verwendete Nachbarschaft als feste Entfernung konstruiert wird oder abhängig von der Dichte der Features in der räumlichen Ausdehnung schwanken darf.

  • Anzahl der NachbarnDie Nachbarschaftsgröße ist eine Funktion der angegebenen Anzahl der Nachbarn, die in die Berechnungen für jedes Feature einbezogen wird. Wo die Features dicht sind, ist die räumliche Ausdehnung der Nachbarschaft kleiner. Bei wenigen Features ist die räumliche Ausdehnung der Nachbarschaft größer.
  • EntfernungsbandDie Nachbarschaftsgröße ist eine konstante oder feste Entfernung für jedes Feature.
String
Auswahlmethode für Nachbarschaften

Gibt an, wie die Nachbarschaftsgröße bestimmt wird.

  • BenutzerdefiniertDie Nachbarschaftsgröße wird mit dem Parameter Anzahl der Nachbarn oder Entfernungsband ermittelt.
String
Anzahl der Nachbarn
(optional)

Die nächste Anzahl der Nachbarn (bis zu 1000), die für jedes Feature berücksichtigt werden muss. Die Anzahl muss ein ganzzahliger Wert zwischen 2 und 1000 sein.

Long
Entfernungsband
(optional)

Die räumliche Ausdehnung der Nachbarschaft.

Linear Unit
Lokales Gewichtungsschema
(optional)

Gibt den Kernel-Typ an, mit dem die räumliche Gewichtung im Modell bereitgestellt wird. Der Kernel definiert, in welchem Zusammenhang die einzelnen Features mit anderen Features in ihrer Nachbarschaft stehen.

  • BiquadratEinem Feature außerhalb der angegebenen Nachbarschaft wird die Gewichtung 0 zugewiesen. Dies ist die Standardeinstellung.
  • GaußAlle Features erhalten Gewichtungen, die Gewichtungen werden jedoch mit der Entfernung vom Ziel-Feature exponentiell kleiner.
String
Data Store
(optional)

Gibt den ArcGIS Data Store an, in dem die Ausgabe gespeichert wird. Alle in einem Big Data Store vom Typ "spatiotemporal" gespeicherten Ergebnisse werden im WGS84 gespeichert. Ergebnisse, die in einem Data Store vom Typ "relational" gespeichert werden, behalten ihr Koordinatensystem bei.

  • Big Data Store vom Typ "spatiotemporal"Die Ausgabe wird in einem Big Data Store vom Typ "spatiotemporal" gespeichert. Dies ist die Standardeinstellung.
  • Data Store vom Typ "relational"Die Ausgabe wird in einem Data Store vom Typ "relational" gespeichert.
String

Abgeleitete Ausgabe

BeschriftungErläuterungDatentyp
Ausgabe

Die Ausgabe-Features.

Record Set

arcpy.geoanalytics.GWR(in_features, dependent_variable, model_type, explanatory_variables, output_features, neighborhood_type, neighborhood_selection_method, {number_of_neighbors}, {distance_band}, {local_weighting_scheme}, {data_store})
NameErläuterungDatentyp
in_features

Die Point-Feature-Class, die die abhängigen und erklärenden Variablen enthält.

Feature Set
dependent_variable

Das numerische Feld mit den beobachteten Werten, die modelliert werden.

Field
model_type

Gibt den Typ der Daten an, die modelliert werden.

  • CONTINUOUSDer Wert für dependent_variable ist kontinuierlich. Das Gauß'sche Modell wird verwendet, und das Werkzeug führt eine Regression des Typs "Kleinste Quadrate" durch.
String
explanatory_variables
[explanatory_variables,...]

Eine Liste von Feldern, die unabhängige erklärende Variablen im Regressionsmodell darstellen.

Field
output_features

Der Name des Ausgabe-Feature-Service.

String
neighborhood_type

Gibt an, ob die verwendete Nachbarschaft als feste Entfernung konstruiert wird oder abhängig von der Dichte der Features in der räumlichen Ausdehnung schwanken darf.

  • NUMBER_OF_NEIGHBORSDie Nachbarschaftsgröße ist eine Funktion der angegebenen Anzahl der Nachbarn, die in die Berechnungen für jedes Feature einbezogen wird. Wo die Features dicht sind, ist die räumliche Ausdehnung der Nachbarschaft kleiner. Bei wenigen Features ist die räumliche Ausdehnung der Nachbarschaft größer.
  • DISTANCE_BANDDie Nachbarschaftsgröße ist eine konstante oder feste Entfernung für jedes Feature.
String
neighborhood_selection_method

Gibt an, wie die Nachbarschaftsgröße bestimmt wird.

  • USER_DEFINEDDie Nachbarschaftsgröße wird mit dem Parameter number_of_neighbors oder distance_band ermittelt.
String
number_of_neighbors
(optional)

Die nächste Anzahl der Nachbarn (bis zu 1000), die für jedes Feature berücksichtigt werden muss. Die Anzahl muss ein ganzzahliger Wert zwischen 2 und 1000 sein.

Long
distance_band
(optional)

Die räumliche Ausdehnung der Nachbarschaft.

Linear Unit
local_weighting_scheme
(optional)

Gibt den Kernel-Typ an, mit dem die räumliche Gewichtung im Modell bereitgestellt wird. Der Kernel definiert, in welchem Zusammenhang die einzelnen Features mit anderen Features in ihrer Nachbarschaft stehen.

  • BISQUAREEinem Feature außerhalb der angegebenen Nachbarschaft wird die Gewichtung 0 zugewiesen. Dies ist die Standardeinstellung.
  • GAUSSIANAlle Features erhalten Gewichtungen, die Gewichtungen werden jedoch mit der Entfernung vom Ziel-Feature exponentiell kleiner.
String
data_store
(optional)

Gibt den ArcGIS Data Store an, in dem die Ausgabe gespeichert wird. Alle in einem Big Data Store vom Typ "spatiotemporal" gespeicherten Ergebnisse werden im WGS84 gespeichert. Ergebnisse, die in einem Data Store vom Typ "relational" gespeichert werden, behalten ihr Koordinatensystem bei.

  • SPATIOTEMPORAL_DATA_STOREDie Ausgabe wird in einem Big Data Store vom Typ "spatiotemporal" gespeichert. Dies ist die Standardeinstellung.
  • RELATIONAL_DATA_STOREDie Ausgabe wird in einem Data Store vom Typ "relational" gespeichert.
String

Abgeleitete Ausgabe

NameErläuterungDatentyp
output

Die Ausgabe-Features.

Record Set

Codebeispiel

GWR: Beispiel (eigenständiges Skript)

Das folgende Skript veranschaulicht die Verwendung des Werkzeugs GWR im Python-Fenster.

In diesen Skript erstellen wir ein Modell, um zu ermitteln, welche Umweltvariablen sich auf eine hohe Waldbrandhäufigkeit auswirken.


# Name: GWR.py
# Description: Run GWR on forest fire occurrence report data to understand 
#              which variables explain reoccurring forest fires
#
# Requirements: ArcGIS GeoAnalytics Server

# Import system modules
import arcpy

# Set local variables
inputFeatures = "https://analysis.org.com/server/rest/services/DataStoreCatalogs/bigDataFileShares_EcoData/BigDataCatalogServer/fireLocations"
outputLayerName = "GWR_ForestFireFrequency"
dependentVariable = "Fire_Frequency"
explanatoryVariables = "GroundCover, TreeCover, SoilMoisture, slope"
distanceValue = "5 Miles"

# Execute GWR
arcpy.geoanalytics.gwr(inputFeatures, dependentVariable, 
                                                    "CONTINUOUS", explanatoryVariables, 
                                                    outputLayerName, "DISTANCE_BAND", 
                                                    "USER_DEFINED", None, distanceValue, 
                                                    "GAUSSIAN", "SPATIOTEMPORAL_DATA_STORE"))

Umgebungen

Sonderfälle

Ausgabe-Koordinatensystem

Das Koordinatensystem, das für die Analyse verwendet wird. Die Analyse wird im Eingabe-Koordinatensystem ausgeführt, sofern nicht anders durch diesen Parameter angegeben. Für GeoAnalytics Tools werden die Endergebnisse im Data Store vom Typ "spatiotemporal" in WGS84 gespeichert.

Lizenzinformationen

  • Basic: Erfordert ArcGIS GeoAnalytics Server
  • Standard: Erfordert ArcGIS GeoAnalytics Server
  • Advanced: Erfordert ArcGIS GeoAnalytics Server

Verwandte Themen