Informationen zur Datenaufschlüsselung

Mit der Business Analyst-Lizenz verfügbar.

Mithilfe der Datenaufschlüsselung können Sie in Geographien der Volkszählung verfügbare Attribute, wie beispielsweise die Gesamtbevölkerung, verwenden, um Informationen für Ihre benutzerdefinierten Geographien, etwa Ringe oder Fahrzeit-Einzugsgebiete, zu berechnen. Der Aufschlüsselungsalgorithmus verwendet einen sekundären Layer (den sogenannten Aufschlüsselungs-Layer), wie z. B. Population Settlement Points, um die Attribute innerhalb eines Polygons zu berechnen. Mittels Datenaufschlüsselung können Sie beispielsweise die Anzahl der von einem Tornado oder Hurrikan betroffenen Menschen, die Anzahl der Senioren, die höchstens 15 Minuten von einem Bürgerzentrum entfernt leben, oder die Anzahl der Haushalte im primären Einzugsgebiet einer Filiale schätzen.

Datenaufschlüsselung ist die Aggregation von ArcGIS Business Analyst-Daten in Ringe und Polygone. ArcGIS Pro verwendet denselben Ansatz für die Aufschlüsselung von Daten wie der GeoEnrichment-Service, bei dem eine differenzierte geographische Abfragemethodik zum Einsatz kommt, um Daten für Ringe und andere Polygone zu aggregieren. Eine geographische Abfragemethodik bestimmt, wie Daten gesammelt und für Eingabe-Features zusammengefasst oder aggregiert werden. Für geographische Standardeinheiten, z. B. Bundesländer, Kantone, Landkreise oder Postleitzahlen, ist die Verknüpfung zwischen einem angegebenen Gebiet und seinen Attributdaten eine einfache Eins-zu-Eins-Beziehung. Wenn z. B. ein Eingabe-Layer für ein Absatzgebiet eine Auswahl von Postleitzahlen enthält, handelt es sich bei der Datenabfrage einfach um das Sammeln der Daten dieser Gebiete.

Zusammenfassung der Daten

Der geographische Abfrageprozess für Ringpuffer, Fahrzeit-Einzugsgebiete und andere Polygone mit nicht standardmäßiger Geographie ist komplizierter, da die Eingabepolygone möglicherweise geographische Gebiete schneiden, deren Daten aggregiert werden müssen.

Im folgenden Diagramm ist dieser Fall dargestellt. Das Polygon in der Mitte steht für ein Eingabe-Untersuchungsgebiet, das angereichert werden soll. Mit dem Geoverarbeitungswerkzeug Layer anreichern in ArcGIS Pro kann z. B. die Gesamtbevölkerung für dieses Gebiet berechnet werden. Die beschrifteten Polygone stehen für Erhebungsgebiete, die Werte für die Gesamtbevölkerung enthalten. In den USA können dies Blockgruppen (Block Groups) mit Anreicherungsdaten sein, in Kanada Verbreitungsgebiete (Dissemination Areas).

Polygon

Der GeoEnrichment-Service verwendet als geographische Abrufmethodik die Methode der gewichteten Schwerpunkte (Weighted Centroids), um Daten für Ringe und andere Polygone zu aggregieren. Bei dieser Abfragemethodik werden Zählblöcke verwendet, um Blockgruppen, die sich nicht ausschließlich innerhalb eines Rings befinden, besser aufschlüsseln zu können. In den USA, Kanada und vielen anderen Länder oder Regionen sind Zählblöcke die kleinste Einheit von Erhebungsgebieten. Diese kleinen Gebiete dienen als Grundlage zum Erstellen aller anderen Ebenen von Erhebungsgebieten. In den USA werden z. B. ein oder mehrere Blöcke zu einer "Block Group" aggregiert.

Die Methode "Weighted Centroid" wird in folgender Abbildung dargestellt:

Methode "Weighted Centroid"

In der obigen Abbildung werden die Census Blocks als schwarze Punkte dargestellt. Beim Gebiet P3 wird die Bevölkerungsgewichtung z. B. durch Summieren der Blockgewichtungen innerhalb dieses Polygons ermittelt. Die Summe dieser Gewichtungen ist der Anteil des Gebiets P3 am Untersuchungsgebiet. Dieser Anteil wird beim Aggregieren und Zusammenfassen einer demografischen Variablen, wie z. B. der Gesamtbevölkerung, zugrunde gelegt. Wenn sich z. B. 90 % der Blöcke von P3 innerhalb des Untersuchungsgebiets befinden und die Gesamtbevölkerung von P3 aus 100 Personen besteht, stellen Sie fest, dass sich 90 Personen des Gebiets P3 innerhalb des Untersuchungsgebiets befinden.

Gewichtete Blöcke

Die Gewichtung w1 des Bereichs P1 ist die Summe der Gewichtungen der Blockpunkte, die zum Schnittpunkt zwischen Bereich P1 und Zielpolygon T gehören:

Formel für die Gewichtung des Bereichs

Hier ist ß ein Block und W1(ß) eine Gewichtung dieses Blocks im Bereich P1.

Beim Zusammenfassen einer demografischen Variablen wie der Gesamtbevölkerung müssen die Gewichtungen für alle sich schneidenden Geographien ermittelt werden. Der GeoEnrichment-Service berechnet die Gewichtung W1(ß) als Verhältnis zwischen der Gesamtbevölkerung von Block (ß), der zum Bereich P1 gehört, und der Summe der Gesamtbevölkerungswerte aller Blöcke des Bereichs P1:

Formel

Funktionsweise der Datenaufschlüsselung

Das Werkzeug "Layer anreichern" in ArcGIS Pro und ArcGIS Online sowie der GeoEnrichment-Service nutzen einen Datenaufschlüsselungsalgorithmus zur Verteilung von demografischen, geschäftlichen, wirtschaftlichen und landschaftsbezogenen Variablen auf Eingabe-Polygon-Features. Der Algorithmus analysiert die einzelnen Polygone, die angereichert werden sollen, relativ zu einem Punkt-Dataset und einem detaillierten Dataset von Berichterstattungseinheit-Polygonen mit Attributen für die ausgewählten Variablen. Abhängig davon, wie ein anzureicherndes Polygon diese Datasets überlagert, bestimmt der Algorithmus die entsprechende Menge, die jeder Variable zugewiesen werden soll.

Je nach dem Land, in dem sich das Anreicherungs-Polygon befindet, stellt das granulare Punkt-Dataset eine der folgenden Optionen dar:

  • Census Block Points: Nur USA und Kanada. Diese Punkte werden anfänglich als Schwerpunkte der detailliertesten Erhebungsgebiete für die Berechnung in diesen Ländern erzeugt: Census Blocks in den USA und Verbreitungsgebiete in Kanada. In einigen Fällen wurden diese Punkte von Esri aus vorwiegend industriell genutzten oder anderen nicht zu Wohngebieten zählenden Flächen in Wohngebiete verschoben. Jeder Punkt enthält Attribute für die Anzahl der Menschen und Haushalte, die sich im entsprechenden Berechnungsgebiet befinden.
  • Settlement points: Für die meisten Länder erzeugt Esri Siedlungspunkte basierend auf einem Wahrscheinlichkeitsmodell für die Besiedelung, das auf Landsat8-Bilddaten und Straßenkreuzungen beruht. Straßenkreuzungen sind vor allem dort hilfreich, wo Gebäude aufgrund der dichten Bewaldung nicht erkennbar sind. Siedlungspunkte werden zunächst als dasymetrische Raster-Oberfläche erzeugt und beziehen sich damit auf Punkte, an denen Menschen nicht leben können oder die verlassen wurden. Diese Raster-Oberfläche wird mit einer Auflösung von 75 Metern erzeugt, was ungefähr der Größe eines Gebäudeblocks entspricht. Das Modell weist jeder Zelle oder jedem Punkt eine Wahrscheinlichkeitspunktzahl für die Besiedlung zu, mit der angegeben wird, wie hoch die Wahrscheinlichkeit ist, dass Menschen dort leben.
  • Adressbasierte Settlement Points: Nur Schweiz und Niederlande. Einige Länder veröffentlichen die Punkte der Wohnadressen ihrer Bürger direkt. Esri aggregiert die Anzahl dieser Adresspunkte in einem Raster mit einer Auflösung von 75 Metern und konvertiert dieses in ein Punkt-Dataset, das Besiedlungspunkten entspricht.
  • Settlement Points für Gebäude-Footprints: Nur AIS-Gruppendaten für Spanien. Die Anzahl der Gebäude-Footprint-Schwerpunkte von Wohngebäuden wird auf ein Raster mit einer Auflösung von 75 Metern summiert, um ein Dataset aus Settlement Points zu erzeugen.

Aufschlüsselungsmethode

Die folgende Abbildung zeigt die Beziehung zwischen dem violetten Ringpuffer-Polygon, das angereichert werden soll, und den dunkelblauen Settlement Points sowie den detaillierten statistischen Polygonen mit grauen Umrissen, auf denen die Anreicherung basiert. So reichern Sie den violetten Ring mit der Gesamtbevölkerung an:

  1. Wählen Sie die statistischen Polygone, die vollständig innerhalb des Ring-Polygons liegen, aus. Diese Polygone werden weiß dargestellt. Berechnen Sie die Summe der Gesamtbevölkerungsvariable für diese Polygone.
  2. Wählen Sie die statistischen Polygone, die sich teilweise mit dem Ring-Polygon überschneiden, aus. Sie werden hellgrün dargestellt. Führen Sie für jedes dieser Polygone die folgenden Schritte aus:
    1. Wählen Sie alle dunkelblauen Siedlungspunkte aus, die darin liegen. Bestimmen Sie mithilfe der Gesamtbevölkerungsvariable aus dem statistischen Polygon und der Summe der Wahrscheinlichkeitspunktzahlen für die Besiedlung das Verhältnis der Menschen pro Besiedlungspunktzahl-Einheit.
    2. Berechnen Sie nur für die Punkte innerhalb des violetten Rings die Summe der Besiedlungswahrscheinlichkeit, und leiten Sie daraus die Anzahl von Menschen ab, die durch diese Punkte dargestellt werden.

      Settlement Points

      Die dunkelblauen Siedlungspunkte stellen zwei Arten von Informationen dar. Zunächst gibt es ein Gitternetz aus Punkten, die im regelmäßigen Abstand von 75 Metern angeordnet sind und das wie oben beschrieben erzeugt wird. Da einige Berichterstattungseinheiten klein genug sind, und zwischen das 75-Meter-Gitternetz zu fallen, werden in einem zweiten Schritt die Schwerpunkte dieser Einheiten hinzugefügt, damit diese Bereiche nicht ausgelassen werden.

Variationen der Aufschlüsselungsmethode

Die obige Beschreibung gilt für die meisten Länder. Für die USA und Kanada jedoch gilt ein vereinfachter Prozess, da die Punkte bereits über ein Attribut mit der dort lebenden Bevölkerung verfügen. Entsprechend wird nur die Summe des Bevölkerungsattributs für die Punkte innerhalb des Anreicherungs-Polygons benötigt, um die Gesamtbevölkerung zu ermitteln. Die Werte von anderen Variablen werden basierend auf vorher berechneten Mittelwerten oder Anteilen der Bevölkerung oder Zusammenfassungen bestimmt.

In den vorstehenden Informationen wird die Standardmethode für die Aufschlüsselung beschrieben, die als BlockApportionment bezeichnet wird. Die BlockApportionment-Methode in ArcGIS Pro wurde optimiert: Wenn ArcGIS Pro ein sehr großes Polygon erkennt, wird eine weniger rechenintensive Methode angewendet. Nimmt die Größe des anzureichernden Bereichs zu, verwendet ArcGIS Pro nun für die Berechnung generalisierte Block-Point-Layer. Die Attributtabelle der Anreicherungsergebnisse enthält im Feld aggregationMethod den Namen der verwendeten Methode.

Bei dieser Methode werden verschiedene Geographien und generalisierte Block Points als Basis für die Aufschlüsselung verwendet. Bei größeren Polygonen werden progressiv gröbere Polygon-Geographien und Block Points mit einer höheren Generalisierung verwendet. So werden bei dieser Methode beispielsweise in den USA anstelle der Blockgruppen-Polygone des US Census Bureau die Grenzen der Zählbezirke und anstelle von Block Points der höchsten Detaillierungsebene generalisierte Block Points als Basis für die Aufschlüsselung verwendet. Zweck dieser Optimierung der Datenaufschlüsselung ist es, bessere Performance bei größerer Genauigkeit zu erzielen.

Diese Schwellenwerte basieren auf den Pufferdurchmessern.

  • In den USA werden die folgenden Durchmesser und Polygon-/Punkt-Datasets verwendet:
    • Blockgruppen und Block Points bei 0 bis 504 Meilen
    • Zählbezirke und Block Points basierend auf der Generalisierungsebene 2 bei 505 bis 786 Meilen
    • Zählbezirke und Block Points basierend auf der Generalisierungsebene 3 bei 787 bis 866 Meilen
    • Zählbezirke und Block Points basierend auf der Generalisierungsebene 4 bei 867 bis 954 Meilen
    • Zählbezirke und Block Points basierend auf der Generalisierungsebene 5 ab 955 Meilen
Tipp:

Das Feld aggregationMethod in der Ausgabe des Werkzeugs Layer anreichern enthält die Aufschlüsselungsmethode, die Geographie-Ebene sowie die Block-Point-Layer, die für die Aufschlüsselung bzw. Anreicherung der Daten verwendet wurden.

Aufschlüsselungs-Layer

Ein Aufschlüsselungs-Layer ist ein Punkt-Feature-Layer mit einem Gewichtungsfeld, das in Statistikdatensammlungen verwendet wird, um Daten zu schätzen und in anderen Layern zu aggregieren. Wenn ein lokales Dataset in Business Analyst verwendet wird, sind die Aufschlüsselungs-Layer standardmäßig Zählblock-Schwerpunkte.

Tipp:

Weitere Informationen finden Sie im Abschnitt Erstellen einer Statistikdatensammlung.

Sie können die folgenden Aufschlüsselungsmethoden auf Datenfelder anwenden:

  • NONE: Es wird keine Aufschlüsselung verwendet.
  • GEOM: Verwendet den geographischen Bereich eines Polygons. Es wird keine Blockpunktaufschlüsselung (Block Point Apportionment) verwendet.
  • POP_W: Verwendet die gewichtete Bevölkerung aus dem Jahr der alle zehn Jahre stattfindenden Volkszählung.
  • HH_W: Verwendet die gewichteten Haushalte aus dem Jahr der alle zehn Jahre stattfindenden Volkszählung.
  • HU_W: Verwendet die gewichteten Wohneinheiten aus dem Jahr der alle zehn Jahre stattfindenden Volkszählung.
  • POP_W_CY: Verwendet die gewichtete Bevölkerung des Datasets des laufenden Jahres.
  • HH_W_CY: Verwendet die gewichteten Haushalte des Datasets des laufenden Jahres.
  • HU_W_CY: Verwendet die gewichteten Wohneinheiten des Datasets des laufenden Jahres.
  • BUS_W_CY: Verwendet die gewichteten Unternehmen des Datasets des laufenden Jahres.
  • Daytime Workers Population: Verwendet die Positionsdaten zur gewichteten Arbeitsbevölkerung des Datasets des laufenden Jahres.
  • Daytime Residents Population: Verwendet die Positionsdaten zur gewichteten Wohnbevölkerung des Datasets des laufenden Jahres.
Hinweis:

Die Liste der Aufschlüsselungsmethoden gilt speziell für die lokalen Daten in den Vereinigten Staaten. Ihre Liste hängt von den installierten lokalen Daten ab und wird aus dem Block-Schwerpunkt-Punkt-Layer abgeleitet.

Mit Statistikdatensammlungen (Statistical Data Collections, SDCX) können Sie den Aufschlüsselungs-Layer so anpassen, dass ein beliebiger Punkt-Layer verwendet wird. Dabei werden Ihre benutzerdefinierten Polygone mit einem benutzerdefinierten Aufschlüsselungs-Layer verbunden, um die Ergebnisse über die Standardmethoden hinaus zu präzisieren. Es ist kein lokal installiertes Dataset erforderlich.

Beispiele für benutzerdefinierte Aufschlüsselungs-Layer

Beispiele für Aufschlüsselungs-Layer sind "International location" und eine "Nondemographic data area".

"International location" - Beispiel

Sie können eine SDCX in Japan erstellen, um anhand der aus Recherchequellen abgeleiteten Daten die historische Bevölkerung in privaten Haushalten zu analysieren, zum Beispiel die Bevölkerung im Jahr 1900. Beginnen können Sie mit den Polygonen der Verwaltungsgebiete der Präfekturen in Japan. Durch deren umfangreiche Grenzen liefert eine reine geometrische Aufschlüsselung keine genauen Ergebnisse. Um Genauigkeit und Granularität und damit die Ergebnisse für diesen speziellen Zeitraum zu erhöhen, können Sie einen neuen Punkt-Feature-Layer laden, der die Besiedlungsorte der Bevölkerung mit Gewichtungen für das Jahr 1900 enthält. Die Gewichtungen können die Anzahl der Haushalte in diesem Jahr enthalten. Wenn Sie die Grenzen von Japan mit dem neuen Aufschlüsselungs-Layer verbinden, können Sie erkennen, wie die Bevölkerung in privaten Haushalten innerhalb beliebiger Grenzen, zum Beispiel in einem Gebiet von 5 Kilometern um Tokio, ausgesehen hat.

"Nondemographic data area" - Beispiel

Sie können auch eine SDCX in den Ölfeldern von Texas erstellen. Zwar ist dort in der Regel die menschliche Besiedlung minimal, trotzdem brauchen Sie eine genaue Schätzung über das Vorkommen an Bodenschätzen. Statt der Verwaltungsgrenzen, wie zum Beispiel Blockgruppen, können Sie mit einem benutzerdefinierten 2 x 2-Meilen-Gitternetz-Layer beginnen, der die aggregierten Positionen der unterirdischen Lagerstätten an Brennstoffen, wie zum Beispiel Erdgas oder Erdöl, enthält. Um Genauigkeit und Granularität zu erhöhen, können Sie einen neuen Punkt-Feature-Layer laden, der die Positionen der Öl- und Gasquellen mit monatlich erhobenen Gewichtungen für die einzelnen natürlichen Ressourcen enthält. Wenn Sie den Gitternetz-Layer mit den Ölfeldern mit dem neuen Aufschlüsselungs-Layer verbinden, können Sie erkennen, wie es um das aktuelle Vorkommen an Bodenschätzen innerhalb beliebiger Grenzen, zum Beispiel in einem definierten Gebiet seismischer Aktivität, bestellt ist.

Festlegen eines Aufschlüsselungs-Layers

Gehen Sie wie folgt vor, um einen Aufschlüsselungs-Layer festzulegen:

  1. Erstellen Sie eine SDCX unter Verwendung eines benutzerdefinierten Grenz-Layers.
  2. Legen Sie im Dialogfeld SDCX-Bearbeitung auf der Registerkarte Quelle als Aufschlüsselungs-Layer einen beliebigen Punkt-Feature-Layer fest. Um höchste Genauigkeit zu erreichen, sollte das Punkt-Feature die benutzerdefinierte Grenze überschneiden. Der Punkt-Feature-Layer muss ein numerisches Feld enthalten, das für die Gewichtung der Aufschlüsselungsmethode verwendet wird. Verwendet wird das erste gefundene numerische Feld.
  3. Als Wert für die Aufschlüsselungsmethode können Sie optional jedes numerische Feld auf der Registerkarte Variablen festlegen.

Alle vorgenommenen Änderungen müssen in einen aktualisierten SDCX-Performance-Index übernommen werden. Diesen Index können Sie auf der Registerkarte Quelle erstellen. Sie können benutzerdefinierte Variablen im Knoten Benutzerdefinierte Daten für jedes Werkzeug auswählen, das den Daten-Browser verwendet, beispielsweise für den Workflow Layer anreichern.