Mit der Geostatistical Analyst-Lizenz verfügbar.
Einführung
In dieser Übung wird gezeigt, wie Sie Flächeninterpolation verwenden, um Daten, die für eine Gruppe von Polygonen (die Quellpolygone) erfasst wurden, zum Vorhersagen der Datenwerte für eine neue Gruppe von Polygonen (die Zielpolygone) zu verwenden. Bei den Daten in dieser Übung handelt es sich um Adipositasraten bei Fünftklässlern im Gebiet von Los Angeles. (Aus Datenschutzgründen wurden die Originaldaten geändert.) Für jeden Schulbezirk wurden Daten für alle Fünftklässler erhoben und die Anzahl der adipösen und nicht adipösen Schüler aufgezeichnet. (Für 14 der Schulbezirke sind keine Daten verfügbar.) Ziel dieser Übung ist es, die auf Schulbezirksebene erfassten Adipositasraten zum Vorhersagen der Adipositasraten in den Blockgruppen innerhalb der Schulbezirke zu verwenden. Außerdem sagen Sie die Adipositasraten für die 14 Schulbezirke vorher, deren Daten fehlen.
Die folgende Grafik zeigt die Schulbezirke von Los Angeles symbolisiert nach den Adipositasraten bei Fünftklässlern. Niedrige Raten sind werden blau dargestellt (Raten von weniger als 22,5 Prozent), und hohe Adipositasraten werden rot dargestellt (Raten von mehr als 44,7 Prozent). In Grün, Gelb und Orange dargestellte Raten liegen in der Mitte. Die schwarzen Polygone entsprechen den Bezirken, deren Daten fehlen. Auf der rechten Seite befinden sich die Blockgruppen im Gebiet von Los Angeles, für das Sie die Adipositasraten bei Fünftklässlern vorhersagen möchten.
Der Prozess der Flächeninterpolation besteht aus zwei Schritten. Zuerst wird aus den Quellpolygonen eine vorhergesagte Oberfläche erstellt. Anschließend wird der Durchschnitt dieser vorhergesagten Oberfläche innerhalb der Zielpolygone berechnet.
Erstellen einer vorhergesagten Oberfläche für Adipositasraten
Der erste Schritt des Flächeninterpolations-Workflows besteht darin, aus den in den Schulbezirken erfassten Adipositasraten eine vorhergesagte Oberfläche zu erstellen. Da bei der Flächeninterpolation das Modell interaktiv angepasst werden muss, muss die vorhergesagte Oberfläche im Geostatistical Wizard erstellt werden.
Den Geostatistical Wizard öffnen
- Starten Sie ArcGIS Pro, und vergewissern Sie sich, dass Sie über eine gültige Lizenz für Erweiterung "ArcGIS Geostatistical Analyst" verfügen.
- Klicken Sie auf dem Menüband auf die Registerkarte Analyse, und klicken Sie auf das Symbol Geostatistical Wizard.
Auswählen der Methode und Identifizieren der Eingabedaten
- Klicken Sie unter Geostatistische Methoden auf Flächeninterpolation.
- Wählen Sie neben Typ die Option Rate aus, da Sie Adipositasraten (und nicht beispielsweise Bevölkerungszahlen) vorhersagen möchten.
- Wählen Sie neben Quellen-Dataset die Option child_obesity aus, um die Polygon-Feature-Class anzugeben, die die Adipositasraten für Schulbezirke enthält.
- Wählen Sie neben Zählfeld die Option 5th_obese aus.
Dieses Feld enthält die Anzahl der adipösen Fünftklässler.
- Wählen Sie neben Feld mit Grundgesamtheit die Option 5th_total aus.
Dieses Feld enthält die Gesamtzahl der Fünftklässler.
- Behalten Sie die Standardeinstellungen für das zweite Dataset bei, da Sie in dieser Übung keine sekundäre Variable verwenden.
- Klicken Sie auf Weiter, um mit der Erstellung des Flächeninterpolationsmodells zu beginnen.
Anpassen der Variografie
Jetzt wird die Variografieseite angezeigt. Dieser Schritt ist der zeitaufwendigste des gesamten Flächeninterpolations-Workflows und der wichtigste für die Erzielung genauer Vorhersagen. Das Ziel ist es, die Parameter auf der rechten Seite so zu ändern, dass die meisten empirischen Kovarianzen (blaue Kreuze) in den Konfidenzintervallen (rote Balken) liegen. Wenn das Modell richtig angegeben ist, ist zu erwarten, dass etwa 90 % der empirischen Kovarianzen innerhalb der Konfidenzintervalle liegen.
In der folgenden Grafik können Sie sehen, dass das Standardmodell nicht ausreichend ist. Die meisten der empirischen Kovarianzen liegen nicht innerhalb der Konfidenzintervalle. Sie müssen einige Schritte ausführen, um das Modell anzupassen.
- Sie können sehen, dass die empirischen Kovarianzen bei einer Entfernung von ungefähr 12.000 Meter negativ werden. Dies bedeutet, dass Sie zunächst Größe der Entfernungsstufen in 1000 ändern und für Anzahl der Entfernungsstufen den Wert 12 beibehalten sollten. (Das Produkt dieser beiden Parameter sollte ungefähr der Entfernung entsprechen, ab der die empirischen Kovarianzen negativ werden.)
Die unten gezeigte Kovarianzkurve sieht besser aus, aber das Modell kann noch optimiert werden. Die große empirische Kovarianz auf der Y-Achse ist problematisch.
- Versuchen Sie, dieses Ergebnis zu verbessern, indem Sie unter Modell den Modelltyp in K-Bessel ändern.
Dieses Modell scheint sehr gut zu den Daten zu passen. Die meisten empirischen Kovarianzen liegen innerhalb der Konfidenzintervalle, und einige wenige befinden sich knapp außerhalb der Intervalle. Bevor Sie sicher sein können, dass das Modell geeignet ist, müssen Sie die Kreuzvalidierungsergebnisse überprüfen.
- Klicken Sie auf Weiter, um den Bereich Suchnachbarschaft anzuzeigen.
Ändern der Suchnachbarschaft
Im Bereich Suchnachbarschaft wird eine Vorschauoberfläche für die Adipositasraten bei Fünftklässlern angezeigt. Sie können auf einen Punkt auf der Vorschauoberfläche klicken, um die für diesen Punkt vorhergesagte Adipositasrate anzuzeigen. In der folgenden Grafik beispielsweise hat die Position des Fadenkreuzes einen vorhergesagten Wert von 0,333177. Das heißt, das Modell sagt vorher, dass mit einer Wahrscheinlichkeit von etwa 33 Prozent alle Fünftklässler an dieser Position adipös sind.
- Klicken Sie auf Weiter, um den Bereich Kreuzvalidierung anzuzeigen.
Untersuchen der Kreuzvalidierungsstatistiken
- Klicken Sie auf die Registerkarte Normal QQ Plot.
Sie können sehen, dass Root-Mean-Square Standardized den Wert 1,1475 aufweist. Das ist gut, da diese Zahl im Idealfall nah bei 1 liegen sollte. Aus dem normalen Q-Q-Plot geht außerdem hervor, dass die Standardfehler fast normal verteilt sind, da die Punkte in der Nähe der Eins-zu-eins-Linie liegen. Dieses Modell verwenden Sie für Ihre Vorhersage.
- Klicken Sie auf Fertig stellen und dann im Dialogfeld Methodenbericht auf OK.
Die vorhergesagte Oberfläche für die Adipositasrate wird auf der Karte angezeigt. Abhängig von Ihrer Analyse ist diese Oberfläche mit der Adipositasrate möglicherweise alles, was Sie benötigen. In diesem Fall können Sie den Workflow hier beenden. Sie möchten jedoch die Adipositasraten von Fünftklässlern auf Blockgruppenebene vorhersagen und fahren daher mit der zweiten Hälfte dieses Flächeninterpolations-Workflows fort.
Hinweis:
Der Layer in der vorstehenden Grafik wurde auf den Interessenbereich zugeschnitten und in 5th grade obesity umbenannt.
Vorhersagen von Adipositasraten in Blockgruppen
Wenn Sie mit Flächeninterpolation eine geeignete vorhergesagte Oberfläche erstellt haben, können Sie die Oberfläche verwenden, um mit dem Geoverarbeitungswerkzeug Flächeninterpolations-Layer in Polygone die Adipositasraten bei Fünftklässlern in Blockgruppen in Los Angeles vorherzusagen.
- Klicken Sie mit der rechten Maustaste auf den Layer 5th grade obesity, blenden Sie das Menü Layer exportieren ein, und wählen Sie In Polygone aus, um das Dialogfeld des Werkzeugs "Flächeninterpolations-Layer in Polygone" zu öffnen.
Hinweis:
Sie können auch über das Toolset Arbeiten mit geostatistischen Layern in der Toolbox Geostatistical Analyst Tools auf das Werkzeug Flächeninterpolations-Layer in Polygone zugreifen.
- Vergewissern Sie sich, dass Geostatistischer Eingabe-Layer für die Flächeninterpolation auf 5th grade obesity festgelegt ist.
- Klicken Sie auf den Dropdown-Pfeil Eingabe-Polygon-Features und dann auf LA_blocks, um die Polygon-Feature-Class der Blockgruppen in Los Angeles anzugeben.
- Klicken Sie neben Ausgabe-Polygon-Feature-Class auf die Schaltfläche zum Durchsuchen, navigieren Sie zu dem Speicherort, an dem die Ausgabe gespeichert werden soll, und geben Sie LA_blocks_obesity als Namen für die Ausgabe-Polygon-Feature-Class ein.
- Vergewissern Sie sich, dass Alle Felder aus Eingabe-Features anhängen aktiviert ist, denn Sie möchten alle Felder aus der Feature-Class "LA_blocks" übernehmen.
- Klicken Sie auf OK, um das Werkzeug auszuführen.
Die Polygon-Feature-Class mit den Vorhersagen für die Adipositasraten bei Fünftklässlern in Blockgruppen in Los Angeles wird der Karte hinzugefügt. Das Feld mit den vorhergesagten Adipositasraten ist mit Vorhergesagt beschriftet. Außerdem sind die Standardfehler der Vorhersage in einem Feld mit der Beschriftung StdError gespeichert.
Hinweis:
Die Symbolisierung in der oben gezeigten Grafik wurde aus den Adipositasraten der Schulbezirke importiert, um einen angemessenen visuellen Vergleich zu ermöglichen.
- Sie können die Blockgruppen auch nach dem Standardfehler der vorhergesagten Adipositasraten symbolisieren. Die Standardfehler werden im Feld "StdError" von "LA_blocks_obesity" gespeichert. Auf diese Weise können Sie Fehlerspannen für die vorhergesagten Adipositasraten erstellen.
Niedrige Standardfehler werden in helleren Rottönen symbolisiert. Größere Blockgruppen weisen meist niedrigere Standardfehler auf, da mit größeren Bereichen mehr Informationen verknüpft sind, sodass die Unsicherheit der Vorhersagen geringer ist.
Damit ist der Workflow zum Vorhersagen der Adipositasraten bei Fünftklässlern in Blockgruppen in Los Angeles aus in Schulbezirken erfassten Raten abgeschlossen.
Vorhersagen von Adipositasraten in Schulbezirken mit fehlenden Daten
Zum Vorhersagen der Adipositasraten in den Schulbezirken, deren Daten fehlen, verwenden Sie wieder das Geoverarbeitungswerkzeug Flächeninterpolations-Layer in Polygone.
- Klicken Sie mit der rechten Maustaste auf den Layer 5th grade obesity, blenden Sie das Menü Layer exportieren ein, und wählen Sie In Polygone aus, um das Dialogfeld des Werkzeugs "Flächeninterpolations-Layer in Polygone" zu öffnen.
- Vergewissern Sie sich, dass Geostatistischer Eingabe-Layer für die Flächeninterpolation auf 5th grade obesity festgelegt ist.
- Klicken Sie auf den Dropdown-Pfeil Eingabe-Polygon-Features und dann auf Missing_zones, um die Polygon-Feature-Class der Schulbezirke mit fehlenden Daten anzugeben.
- Klicken Sie neben Ausgabe-Polygon-Feature-Class auf die Schaltfläche zum Durchsuchen, navigieren Sie zu dem Speicherort, an dem die Ausgabe gespeichert werden soll, und geben Sie Missing_zones_obesity als Namen für die Ausgabe-Polygon-Feature-Class ein.
- Vergewissern Sie sich, dass Alle Felder aus Eingabe-Features anhängen aktiviert ist, denn Sie möchten alle Felder aus der Feature-Class "Missing_zones" übernehmen.
- Klicken Sie auf OK, um das Werkzeug auszuführen.
Die Polygon-Feature-Class mit den Vorhersagen für die Adipositasraten bei Fünftklässlern in den fehlenden Schulbezirken in Los Angeles wird der Karte hinzugefügt. Das Feld mit den vorhergesagten Adipositasraten ist mit Vorhergesagt beschriftet. Außerdem sind die Standardfehler der Vorhersage in einem Feld mit der Beschriftung StdError gespeichert.
Hinweis:
Die Symbolisierung wurde aus den Adipositasraten der Schulbezirke importiert.
Sie haben den Workflow zum Vorhersagen der Adipositasraten bei Fünftklässlern in Schulbezirken in Los Angeles, deren Daten fehlten, abgeschlossen.
Sie können ArcGIS Pro schließen, ohne Ihre Ergebnisse zu speichern.
Datenreferenz
- Rosenshein, L. "The Local Nature of a National Epidemic: Childhood Overweight and the Accessibility of Healthy Food". Masterarbeit, George Mason University, Department of Geography and GeoInformation Science, Fairfax, Virginia, USA, 2010.