Dieses Geoverarbeitungswerkzeug ist ab ArcGIS Enterprise 10.8.1 verfügbar.
Dieses Werkzeug führt eine geographisch gewichtete Regression (GWR) durch, eine lokale Form von Regression zur Modellierung räumlich variierender Beziehungen. Das GWR-Werkzeug erstellt ein lokales Modell der Variable oder des Prozesses, die bzw. den Sie verstehen oder vorhersagen möchten, indem eine Regressionsgleichung an jedes Feature im Dataset angepasst wird. Das Werkzeug Geographisch gewichtete Regression (GWR) erstellt diese separaten Gleichungen durch Einbeziehung der abhängigen und erklärenden Variablen von Features in der Nachbarschaft der einzelnen Ziel-Features. Form und Ausdehnung jeder analysierten Nachbarschaft basieren auf den Eingaben für die Parameter Nachbarschaftstyp und Auswahlmethode für Nachbarschaften.
Wenden Sie das GWR-Werkzeug auf Datasets mit mehreren hundert Features an, um optimale Ergebnisse zu erzielen. Für kleine Datasets ist dieses Werkzeug nicht geeignet. Das Werkzeug funktioniert nicht mit Multipoint-Daten.
Verwenden Sie den Parameter Eingabe-Features mit einem Feld, das das Phänomen darstellt, das Sie modellieren (die abhängige Variable), und einem oder mehreren Feldern, die die Parameterwerte Erklärende Variable(n) darstellen. Diese Felder müssen numerisch sein und einen Wertebereich aufweisen. Features, in deren abhängiger oder erklärender Variable Werte fehlen, werden aus der Analyse ausgeschlossen. Werte können mit dem Werkzeug Feld berechnen geändert werden. Wenn Ihre Daten zur Verwendung in ArcGIS Pro bereit sind, ergänzen Sie das Dataset mit dem Werkzeug Fehlende Werte ausfüllen um die fehlenden Werte, bevor Sie das Werkzeug Geographisch gewichtete Regression (GWR) ausführen.
Das Werkzeug Geographisch gewichtete Regression (GWR) erzeugt zudem Ausgabe-Features und fügt Felder hinzu, die lokale Diagnosewerte angeben. Die Parameterwerte Ausgabe-Features und verknüpfte Diagramme werden automatisch dem Inhaltsverzeichnis hinzugefügt, wobei ein Hot/Cold-Rendering-Schema zur Modellierung von Residuen angewendet wird. Eine vollständige Erläuterung der einzelnen Ausgaben finden Sie im Thema Funktionsweise des Werkzeugs "Geographisch gewichtete Regression (GWR)".
Das Werkzeug Geographisch gewichtete Regression (GWR) erzeugt eine Vielzahl von Ausgaben. Während der Ausführung des Werkzeugs wird unten im Bereich Geoverarbeitung eine Zusammenfassung des GWR-Modells in Form einer Meldung angezeigt. Sie können auf diese Meldung zugreifen, indem Sie mit der Maus auf die Fortschrittsleiste zeigen, auf die Pop-out-Schaltfläche klicken oder den Abschnitt "Meldungen" im Bereich Geoverarbeitung erweitern. Sie können auch über den Geoverarbeitungsverlauf auf die Meldungen einer früheren Ausführung des Werkzeugs Geographisch gewichtete Regression (GWR) zugreifen.
Sie müssen projizierte Daten verwenden.
Es ist üblich, die Daten global mit dem Werkzeug Generalisierte lineare Regression zu erkunden, bevor Sie die Daten lokal mit dem Werkzeug Geographisch gewichtete Regression (GWR) erkunden.
Die Parameter Abhängige Variable und Erklärende Variable(n) müssen numerische Felder sein, die eine Vielzahl von Werten enthalten. Es sollte global und lokal eine Variation in diesen Werten geben. Verwenden Sie deshalb keine erklärenden "Dummy"-Variablen, um die verschiedenen räumlichen Ordnungen in Ihrem GWR-Modell darzustellen (z. B. Zuweisen des Wertes 1 zu Zählbezirken außerhalb des Stadtkerns, wenn allen anderen der Wert 0 zugewiesen wird). Da beim Werkzeug Geographisch gewichtete Regression (GWR) die erklärenden Variablenkoeffizienten variieren können, sind diese erklärenden Variablen für räumliche Ordnungen unnötig. Wenn sie einbezogen werden, können sie Probleme aufgrund von lokaler Multikollinearität verursachen.
In globalen Regressionsmodellen wie Generalisierte lineare Regression sind die Ergebnisse unzuverlässig, wenn zwei oder mehr Variablen Multikollinearität aufweisen (wenn zwei oder mehr Variablen redundant sind oder das Gleiche aussagen). Das Werkzeug Geographisch gewichtete Regression (GWR) erstellt eine lokale Regressionsgleichung für jedes Feature im Dataset. Wenn die Werte für eine bestimmte erklärende Variable zur räumlichen Cluster-Bildung neigen, liegen wahrscheinlich Probleme mit lokaler Multikollinearität vor. Das Feld für angepasste Bedingungswerte (COND_ADJ) in der Ausgabe-Feature-Class gibt an, wann Ergebnisse aufgrund von lokaler Multikollinearität instabil sind. Betrachten Sie im Allgemeinen Ergebnisse für Features mit einem angepassten Bedingungswert größer als 30, gleich null oder (für Shapefiles) gleich -1.7976931348623158e+308 skeptisch.
Bei Verwendung von Nominal- oder Kategoriedaten in einem GWR-Modell ist Vorsicht angebracht. Wenn Kategorien zur Bildung von räumlichen Clustern neigen, treten u. U. Probleme aufgrund von lokaler Multikollinearität auf. Der in der Ausgabe des GWR-Werkzeugs enthaltene angepasste Bedingungswert gibt an, wann lokale Kollinearität ein Problem darstellt (ein angepasster Bedingungswert kleiner als 0, größer als 30 oder gleich NULL). Bei einer starken lokalen Multikollinearität sind die Ergebnisse instabil.
Bei einem falsch angegebenen Regressionsmodell handelt es sich um ein Modell, in dem eine wichtige erklärende Variable fehlt. Die statistisch signifikante räumliche Autokorrelation in den Regressionsresiduen oder die unerwartete räumliche Variation unter den Koeffizienten einer oder mehrerer erklärender Variablen weist darauf hin, dass das Modell falsch angegeben ist. Ermitteln Sie mit allen verfügbaren Analysemethoden (zum Beispiel die Untersuchung von GLR-Residuen und GWR-Koeffizientenvariationen), welche wichtigen Variablen fehlen, und nehmen Sie diese in das Modell auf.
Hinterfragen Sie stets, ob es sinnvoll ist, dass eine erklärende Variable nicht stationär ist. Nehmen Sie beispielsweise an, Sie modellieren die Dichte einer bestimmten Pflanzenart als Funktion mehrerer Variablen einschließlich ASPECT. Wenn Sie feststellen, dass sich der Koeffizient für die Variable ASPECT über das Untersuchungsgebiet hinweg ändert, weist dies darauf hin, dass eine wichtige erklärende Variable fehlt (zum Beispiel die Verbreitung einer konkurrierenden Vegetationsart). Treffen Sie alle möglichen Maßnahmen, damit alle wichtigen erklärenden Variablen in Ihrem Regressionsmodell enthalten sind.
Wenn das Ergebnis einer Berechnung unendlich oder nicht definiert ist, lautet das Ergebnis für Nicht-Shapefiles NULL.
Schwerwiegende Probleme beim Modellentwurf oder Fehler mit der Meldung, dass die Anzahl an Nachbarn in lokalen Gleichungen nicht ausreicht, weisen oft auf globale oder lokale Multikollinearität hin. Um die Problemursache zu ermitteln, führen Sie ein globales Modell mit Generalisierte lineare Regression aus, und untersuchen Sie den VIF-Wert für jede erklärende Variable. Wenn einige der VIF-Werte sehr groß sind (z. B. größer als 7,5), verhindert die globale Multikollinearität die Berechnung mit dem GWR-Werkzeug. Jedoch ist wahrscheinlich eher eine lokale Multikollinearität das Hauptproblem. Versuchen Sie, eine thematische Karte für jede erklärende Variable zu erstellen. Wenn die Karte räumliche Cluster-Bildung von identischen Werten erkennen lässt, entfernen Sie diese Variablen aus dem Modell oder kombinieren Sie diese Variablen mit anderen erklärenden Variablen, um die Wertvariation zu erhöhen. Wenn Sie beispielsweise Immobilienwerte modellieren und für Schlafzimmer wie auch Badezimmer über Variablen verfügen, ist es möglicherweise sinnvoll, diese zu kombinieren, um die Wertvariation zu erhöhen oder sie als kombinierte Größe darzustellen. Vermeiden Sie beim Erstellen von GWR-Modellen die Verwendung der folgenden Variablen: Dummy-Variablen für räumliche Ordnungen, Kategorievariablen bzw. nominale Variablen für räumliche Cluster-Bildung oder Variablen mit sehr wenigen möglichen Werten.
Geographisch gewichtete Regression ist ein lineares Modell, für das die gleichen Anforderungen wie für Generalisierte lineare Regression gelten. Prüfen Sie die in Funktionsweise des Werkzeugs "Geographisch gewichtete Regression (GWR)" erläuterte Diagnose, um sicherzustellen, dass Ihr GWR-Modell ordnungsgemäß festgelegt ist. Nicht alle beschriebenen Diagnosefunktionen sind in der Toolbox "GeoAnalytics Desktop" verfügbar. Der Abschnitt Wie Regressionsmodelle ungültig werden im Thema "Grundlagen zur Regressionsanalyse" bietet ebenfalls Informationen, um die Richtigkeit Ihres Modells sicherzustellen.
Mithilfe der folgenden Schritte können Sie die Performance des Werkzeugs Geographisch gewichtete Regression (GWR) verbessern:
- Legen Sie die Ausdehnungsumgebung so fest, dass nur die gewünschten Daten analysiert werden.
- Reduzieren Sie die Anzahl der Nachbarn in Ihrer Berechnung.
- Verwenden Sie die Option Anzahl der Nachbarn statt der Option Entfernungsband im Parameter Nachbarschaftstyp (neighborhood_type = "NUMBER OF NEIGHBORS" in Python).
- Verwenden Sie weniger erklärende Variablen, wenn möglich.
- Verwenden Sie lokale Daten an der Stelle, an der die Analyse ausgeführt wird.
Dieses Geoverarbeitungswerkzeug wird unterstützt durch ArcGIS GeoAnalytics Server. Die Analyse wird auf dem GeoAnalytics Server ausgeführt, und die Ergebnisse werden in den eigenen Inhalten in ArcGIS Enterprise gespeichert.
Bei der Ausführung von GeoAnalytics Server-Werkzeugen wird die Analyse auf dem GeoAnalytics Server abgeschlossen. Für eine optimale Performance sollten die Daten dem GeoAnalytics Server über Feature-Layer zur Verfügung stehen, die auf Ihrem ArcGIS Enterprise-Portal gehostet werden. Alternativ können Big-Data-Dateifreigaben verwendet werden. Daten, auf die der GeoAnalytics Server nicht lokal zugreifen kann, werden vor Analysebeginn auf den GeoAnalytics Server verschoben. Dadurch dauert die Ausführung eines Werkzeugs länger. Es kann zudem vorkommen, dass das Verschieben der Daten von ArcGIS Pro zum GeoAnalytics Server fehlschlägt. Die Wahrscheinlichkeit eines Fehlers hängt dabei von der Netzwerkgeschwindigkeit sowie der Größe und Komplexität der Daten ab. Es wird empfohlen, dass Sie Ihre Daten stets freigeben oder eine Big-Data-Dateifreigabe erstellen.
Weitere Informationen zum Freigeben von Daten in Ihrem Portal
Weitere Informationen zum Erstellen einer Big-Data-Dateifreigabe über Server Manager
Eine ähnliche Analyse ist auch mit dem Werkzeug Geographisch gewichtete Regression möglich. Verwenden Sie das Werkzeug in der Toolbox "Spatial Statistics" für folgende Workflows:
- Lokale Layer Ihres ArcGIS Pro-Computers verwenden (z. B. Feature-Classes in einer File-Geodatabase).
- Anderen Layer vorhersagen oder Raster-Koeffizienten-Layer erstellen.
- Binäre (logistische) Variable oder die Variable Anzahl (Poisson) modellieren.
- Nachbarschaftssuche mit Golden Search oder manuellen Intervallen definieren.