Comprendre la répartition des données

Disponible avec une licence Business Analyst.

Répartition des données

ArcGIS Pro utilise une méthodologie d’extraction géographique pondérée des centroïdes pour agréger les données des anneaux et d’autres polygones. La méthode d’extraction pondérée des centroïdes utilise les données des îlots de recensement pour mieux répartir les groupes d’îlots qui ne sont pas exclusivement contenus dans un polygone. Vous pouvez appliquer les méthodes de répartition suivantes aux champs de données :

  • NONE : aucune répartition n’est utilisée.
  • GEOM : utilise la surface géographique d’un polygone. Aucune répartition ponctuelle sur une maille fine n’est utilisée.
  • POP_W : utilise la population pondérée de l’année de recensement décennal.
  • HH_W : utilise les ménages pondérés de l’année de recensement décennal.
  • HU_W : utilise les logements pondérés de l’année de recensement décennal.
  • POP_W_CY : utilise la population pondérée du jeu de données de l’année actuelle.
  • HH_W_CY : utilise les ménages pondérés du jeu de données de l’année actuelle.
  • HU_W_CY : utilise les logements pondérés du jeu de données de l’année actuelle.
  • BUS_W_CY : utilise les entreprises pondérées du jeu de données de l’année actuelle.
  • Population des travailleurs de jour : utilise les emplacements de la population des travailleurs pondérés du jeu de données de l’année actuelle.
  • Population des habitants de jour : utilise les emplacements de la population des habitants pondérés du jeu de données de l’année actuelle.
Remarque :

La liste des méthodes de répartition est spécifique aux données locales des États-Unis. Votre liste dépend des données locales installées et est issue de la couche de points des centroïdes d’îlots.

Couches de répartition

Une couche de répartition est une entité ponctuelle contenant un champ de pondération utilisé dans les collections de données statistiques (SDCX) pour estimer et agréger les données dans d’autres couches. Lorsque vous utilisez un jeu de données local dans Business Analyst, les couches de répartition, par défaut, sont des centroïdes d’îlots de recensement. Les collections de données statistiques vous permettent de personnaliser la couche de répartition afin d’utiliser n’importe quelle couche de points. Ceci permet d’associer vos polygones personnalisés à une couche de répartition personnalisée afin d’affiner les résultats et d’utiliser d’autres méthodes que celles par défaut. Aucun jeu de données installé localement n’est requis.

Exemples de couches de répartition

L’emplacement international et la surface de données non démographiques sont des exemples de couches de répartition.

Exemple d’emplacement international

Vous pouvez créer une collection de données statistiques (SDCX) au Japon pour analyser la population des ménages historiques (par exemple, la population en 1900) à l’aide de données issues de sources de recherche. Vous pouvez commencer par les polygones de division administrative (préfecture) du Japon. Ces polygones ont des limites importantes et présentent une répartition géométrique corrigée qui ne renvoie pas des résultats exacts. Pour améliorer l’exactitude et la granularité (et obtenir des résultats propres à cette période), vous pouvez charger une nouvelle couche d'entités ponctuelles contenant les emplacements où la population s’est installée, avec des pondérations pour l’année 1900. Les pondérations peuvent contenir le nombre de ménages de l’année en question. L’association des limites japonaises à la nouvelle couche de répartition vous permet de mieux cerner la population des ménages dans n’importe quelle limite, par exemple dans une zone de 5 kilomètres autour de Tokyo.

Exemple de surface de données non démographiques

Vous pouvez créer une collection de données statistiques (SDCX) dans les champs pétrolifères du Texas, où la population humaine risque d’être minimale, mais où vous devez tout de même estimer avec exactitude les niveaux des ressources souterraines. Au lieu de limites administratives, comme des groupes d’îlots, vous pouvez commencer par une couche de carroyage personnalisée de 2x2 miles contenant des emplacements agrégés de gisements souterrains, par exemple de gaz naturel ou de pétrole brut. Pour améliorer l’exactitude et la granularité, vous pouvez charger une nouvelle couche d'entités ponctuelles contenant les emplacements des puits de pétrole et de gaz avec des pondérations mensuelles pour chaque type de ressource naturelle. L’association de la couche de carroyage des champs pétrolifères à la nouvelle couche de répartition vous permet de mieux cerner les niveaux des ressources actuelles dans n’importe quelle limite, par exemple une zone définie présentant une activité sismique.

Créer une couche de répartition

Pour créer une couche de répartition, procédez comme suit :

  1. Créez une collection de données statistiques (SDCX) à l’aide d’une couche de limite personnalisée.
  2. Dans la boîte de dialogue SDCX Edit (Mise à jour SDCX), dans l’onglet Source, définissez Apportionment Layer (Couche de répartition) sur une couche d'entités ponctuelles. Pour améliorer la précision, l’entité ponctuelle doit intersecter la limite personnalisée. La couche d'entités ponctuelles doit contenir un champ numérique utilisé pour la pondération Apportionment Method (Méthode de répartition). Le premier champ numérique trouvé est utilisé.
  3. Vous pouvez également définir Apportionment Method (Méthode de répartition) sur un champ numérique dans l’onglet Variables.

Toutes les modifications apportées sont répercutées dans un index de performance SDCX actualisé. Vous pouvez créer l’index à partir de l’onglet Source. Vous pouvez sélectionner vos variables personnalisées dans le nœud Custom Data (Données personnalisées) de n’importe quel outil qui utilise l’explorateur de données, par exemple le processus Enrich Layer (Enrichir la couche).