Synthétiser le centre et la dispersion (GeoAnalytics)

Résumé

Recherche des entités centrales et des distributions directionnelles et calcule les emplacements moyens et médians à partir de l’entrée.

Illustration

Illustration de l'outil Synthétiser le centre et la dispersion

Utilisation

  • Cet outil peut être utilisé pour la centralité et la dispersion des entités. Voici quelques exemples de situations où l’utilisation de cet outil s’avère utile :

    • Une administration locale prévoit d’ouvrir une nouvelle bibliothèque pour une communauté non desservie. Les centroïdes des groupes de blocs avec le zonage approprié et les lots disponibles ont été collectés. Le calcul d’une entité centrale avec une pondération sur la population peut être utilisé pour identifier le groupe de blocs central qui servira au mieux la communauté.
    • Un analyste SIG analyse les emplacements des appels 911 et ceux des postes d’intervention d’urgence (police, pompiers et ambulances). Un résultat de centre moyen permet de comparer le centre moyen des appels d’urgence au centre moyen des postes d’intervention afin d’optimiser le temps de réponse.
    • Un analyste de la criminalité souhaite déterminer si le centre médian des cambriolages se déplace lors de l’évaluation des incidents de jour et de nuit. Le calcul d’un centre médian avec un groupe par heure de la journée permet de déterminer où sont commis les délits au cours de la journée et de la nuit.
    • Un analyste SIG d’une organisation non gouvernementale analyse la propagation d’une maladie infectieuse. Une ellipse peut être utilisée pour modéliser la propagation de l’épidémie.

  • Le paramètre Weight Field (Champ de pondération) permet de pondérer les emplacements en fonction de leur importance relative. Il est par exemple possible de pondérer les magasins d’une grande chaîne par rapport au total des ventes, ou les entités surfaciques par rapport à leur surface. Reportez-vous à la section Application des pondérations pour plus d'informations sur la façon dont les pondérations sont appliquées dans l’analyse.

  • Le paramètre Group by Field (Regrouper par champ) permet de regrouper les entités pour des calculs distincts des entités centrales ou de la dispersion. Par exemple, les observations de la faune tout au long de l’année peuvent être regroupées par saison ou par mois. Ce champ peut être de type entier, date ou chaîne. Les enregistrements comportant des valeurs nulles seront regroupés ensemble.

  • L’entité centrale est l’entité associée à la plus petite distance cumulée vers toutes les autres entités du jeu de données. Cette entité est identifiée et incluse dans la sortie Central Feature Layer (Couche d’entités centrales). Plusieurs entités peuvent partager la plus petite distance cumulée vers toutes les autres entités. Lorsque c’est le cas, toutes les entités les plus centrales sont incluses dans la sortie Central Feature Layer (Couche d’entités centrales). Lorsqu'une valeur de paramètre Group By Field (Grouper par champ) est spécifiée, les entités en entrée sont groupées en premier selon les valeurs du champ ; une entité centrale est ensuite identifiée pour chaque groupe.

  • Le centre moyen est un point construit à partir des coordonnées x et y moyennes. Les entités de centre moyen sont incluses dans la sortie Mean Center Layer (Couche de centre moyen). Lorsqu'une valeur Group By Field (Grouper par champ) est spécifiée, les entités en entrée sont groupées en premier selon les valeurs du champ ; le centre moyen est ensuite calculé pour chaque groupe.

  • Le centre médian utilise un algorithme itératif pour identifier le point géométrique médian qui minimise la distance euclidienne vers toutes les entités du jeu de données. Les entités de centre médian sont incluses dans la sortie Median Center Layer (Couche de centre médian). Lorsqu'une valeur Group By Field (Grouper par champ) est spécifiée, les entités en entrée sont groupées en premier selon les valeurs du champ ; le centre médian est ensuite calculé pour chaque groupe. Contrairement aux résultats de l’opération de centre moyen, les résultats de l’opération de centre médian sont moins influencés par les entités aberrantes.

  • Des ellipses d'écart type sont créées pour récapituler les caractéristiques spatiales des entités géographiques : tendance centrale, dispersion et tendances directionnelles. Les ellipses peuvent être dimensionnées en 1, 2 ou 3 écarts types. Les entités ellipses sont incluses dans la sortie Ellipse Layer (Couche d’ellipses). Lorsqu'une valeur Group By Field (Grouper par champ) est spécifiée, les entités en entrée sont groupées en premier selon les valeurs du champ ; une ellipse est ensuite calculée pour chaque groupe.

  • Vous pouvez spécifier un ou plusieurs types de résumés à générer. Chaque type de résumé sera généré dans une couche d’entités unique.

  • Si la couche en entrée comporte des entités ayant des valeurs de temps ou de géométrie nulles, les entités ne seront pas utilisées dans l’analyse.

  • Si la couche en entrée est temporelle, les résultats ne représenteront pas le centre temporel. Seul l’aspect spatial est pris en compte lors du calcul de la tendance centrale et de la dispersion.

  • Outre les champs provenant de la couche en entrée, les champs suivants seront inclus dans le résultat du type de résumé Central Feature (Entité centrale) en sortie :

    Nom du champDescription

    CoordX

    Coordonnée x de l’entité centrale. Si l’entité est une ligne ou un polygone, la valeur représentera le centroïde de l’entité.

    CoordY

    Coordonnée y de l’entité centrale. Si l’entité est une ligne ou un polygone, la valeur représentera le centroïde de l’entité.

    instant_datetime

    Si la couche en entrée est temporelle avec un temps de type instant, le résultat en sortie inclura un champ de date de type instant représentant l’heure de l’entité en sortie.

  • Outre la valeur du paramètre facultatif Group By Field (Grouper par champ) utilisée dans l’analyse, les champs suivants seront inclus dans les résultats du type de résumé Mean Center (Centre moyen) et Median Center (Centre médian) en sortie :

    Nom du champDescription

    CoordX

    Coordonnée x de l’entité médiane ou moyenne.

    CoordY

    Coordonnée y de l’entité médiane ou moyenne.

    instant_datetime

    Si la couche en entrée est temporelle avec un temps de type instant, le résultat en sortie inclura un champ de date de type instant représentant l’heure de l’entité en sortie.

  • Outre la valeur du paramètre facultatif Group By Field (Grouper par champ) utilisée dans l’analyse, les champs suivants seront inclus dans le type de résumé Ellipse en sortie :

    Nom du champDescription

    CenterX

    Coordonnée x du centre moyen de l’ellipse.

    CenterY

    Coordonnée y du centre moyen de l’ellipse.

    CenterT

    Valeur temporelle du centre moyen de l’ellipse.

    Rotation

    Rotation de l'axe long mesurée dans le sens horaire à partir de midi. Cette valeur est mesurée en degrés.

    MajStdDist

    La distance standard du demi-grand axe. Cette valeur est mesurée en degrés.

    MinStdDist

    La distance standard du demi-petit axe. Cette valeur est mesurée en degrés.

    TmStdDist

    La distance temporelle standard. Cette valeur est une durée mesurée en millisecondes.

  • Les attributs des valeurs des coordonnées, par exemple CoordX et CoordY seront calculés à l’aide de la référence spatiale de l’analyse. Par défaut, la référence spatiale de l’analyse est la même que celle de la couche en entrée. Vous pouvez éventuellement spécifier la référence spatiale utilisée dans l’analyse à l’aide de la variable d'environnement du système de coordonnées en sortie.

    Si vous écrivez les résultats dans le répertoire de données temporelles, les entités de résultats seront représentées par le système de coordonnées WGS 1984 (WKID 4326). Ce qui signifie que les valeurs géométriques de vos entités de résultats peuvent être stockées dans des systèmes de coordonnées différents de celui des valeurs attributaires en sortie. Par exemple, si vous générez en sortie une couche de centre moyen dans le répertoire de données spatiotemporelles et que vous spécifiez comme valeur d’environnement du système de coordonnées en sortie NAD 1983 UTM Zone 1N (WKID 26901), les valeurs calculées pour les champs CoordX et CoordY se trouveront dans le système NAD 1983 UTM Zone 1N (WKID 26901), tandis que les entités sur la carte seront dans le système de coordonnées WGS 1984 (WKID 4326).

  • Vous pouvez améliorer les performances de l’outil Synthétiser le centre et la dispersion en suivant les conseils ci-après :

    • Définissez l’environnement de l’étendue de manière à analyser uniquement des données d’intérêt.
    • Utilisez les données locales de l’environnement de l’analyse.
    • Groupez vos données à l’aide du paramètre Group By Field (Grouper par champ).
    • Pour les jeux de données plus volumineux, le type de résumé lMedian Center (Centre médian) peut s’avérer le moins performant en raison de ses calculs itératifs.

  • Cet outil de géotraitement est mis en œuvre par ArcGIS GeoAnalytics Server. L’analyse est réalisée sur le GeoAnalytics Server et les résultats sont stockés dans votre contenu dans ArcGIS Enterprise.

  • Lors de l’exécution des outils GeoAnalytics Server, l’analyse est réalisée sur GeoAnalytics Server. Pour des performances optimales, GeoAnalytics Server doit pouvoir accéder aux données via les couches d’entités hébergées sur votre portail ArcGIS Enterprise ou les partages de fichiers Big Data. Les données qui ne sont pas locales pour GeoAnalytics Server sont transférées sur GeoAnalytics Server avant le début de l’analyse. Autrement dit, l’exécution d’un outil prend plus de temps et, dans certains cas, le transfert des données entre ArcGIS Pro et GeoAnalytics Server peut échouer. Le seuil d’échec dépend aussi bien des débits du réseau que de la taille et de la complexité des données. Il est par conséquent recommandé de toujours partager les données ou créer un partage de fichiers Big Data.

    Pour en savoir plus sur le partage des données dans votre portail.

    Pour en savoir pus sur la création d'un partage de fichiers Big Data via ArcGIS Server Manager

Syntaxe

arcpy.geoanalytics.SummarizeCenterAndDispersion(input_layer, output_name, generate_types, {ellipse_size}, {weight_field}, {group_by_field}, {data_store})
ParamètreExplicationType de données
input_layer

La couche de points à synthétiser.

Feature Set
output_name

Nom du service d'entités en sortie.

String
generate_types
[generate_types,...]

Spécifie les types de résumés à générer. Vous pouvez utiliser un ou plusieurs types de résumés. Une couche unique sera créée pour chaque type de résumé sélectionné.

  • CENTRAL_FEATUREUne couche sera créée contenant une copie de l’entité la plus centrale dans la couche en entrée.
  • MEAN_CENTERUne couche de points sera créée représentant le centre moyen de la couche en entrée.
  • MEDIAN_CENTERUne couche de points sera créée représentant le centre médian de la couche en entrée.
  • ELLIPSEUne couche de polygones sera créée représentant l’ellipse directionnelle de la couche en entrée.
String
ellipse_size
(Facultatif)

Spécifie la taille des ellipses en sortie en écarts types.

  • 1_STANDARD_DEVIATIONLes ellipses en sortie couvriront un écart type des entités en entrée. Il s’agit de l’option par défaut.
  • 2_STANDARD_DEVIATIONSLes ellipses en sortie couvriront deux écarts types des entités en entrée.
  • 3_STANDARD_DEVIATIONSLes ellipses en sortie couvriront trois écarts types des entités en entrée.
String
weight_field
(Facultatif)

Champ numérique permettant de pondérer les emplacements en fonction de leur importance relative. Ceci s'applique à tous les types de résumés.

Field
group_by_field
(Facultatif)

Champ utilisé pour regrouper des entités similaires. Ceci s'applique à tous les types de résumés. Par exemple, si vous choisissez un champ nommé PlantType contenant des valeurs liées aux arbres, buissons et herbages, toutes les entités avec la valeur arbre seront analysées pour leur propre centre ou dispersion. Cet exemple aura pour résultat trois entités, une pour chaque groupe d’arbres, de buissons et d’herbages.

Field
data_store
(Facultatif)

Indique le ArcGIS Data Store dans laquelle la sortie est enregistrée. La valeur par défaut est SPATIOTEMPORAL_DATA_STORE. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées.

  • SPATIOTEMPORAL_DATA_STORELa sortie sera stockée dans un stockage de Big Data spatio-temporelles. Il s’agit de l’option par défaut.
  • RELATIONAL_DATA_STORELa sortie sera stockée dans un data store relationnel.
String

Sortie dérivée

NomExplicationType de données
out_central_feature_layer

La couche contenant l’entité centrale provenant de la couche en entrée.

Classe d’entités
out_mean_center_layer

La couche de points contenant les représentations de centre moyen de la couche en entrée.

Classe d’entités
out_median_center_layer

La couche de points contenant les représentations de centre médian de la couche en entrée.

Classe d’entités
out_ellipse_layer

La couche de polygones contenant les représentations d’ellipse de la couche en entrée.

Classe d’entités

Exemple de code

SummarizeCenterAndDispersion (script autonome)

Le script autonome suivant illustre l'utilisation de l'outil SummarizeCenterAndDispersion.

# Name: SummarizeCenterAndDispersion.py
# Description: Calculate a standard deviational ellipse of contagious disease 
#              data to understand the spread of the disease over time. 
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
# This example calculates a standard deviational ellipse for 3 standard 
# deviations of the data
inFeatures = "https://sampleserver6.com/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_myBDFS/BigDataCatalogServer/diseaseRecords"
outFS = "disease_movement_ellipse"
summaryType = "ELLIPSE"
dataStore = "RELATIONAL_DATA_STORE"
# Execute SummarizeCenterAndDispersion
arcpy.geoanalytics.SummarizeCenterAndDispersion(inFeatures, outFS, summaryType, 
                                                "3_STANDARD_DEVIATIONS", "", 
                                                "", "", "", "" dataStore)

Environnements

Système de coordonnées en sortie

Système de coordonnées qui sera utilisé pour l'analyse. L’analyse sera réalisée dans le système de coordonnées en entrée, à moins que ce paramètre en spécifie un autre. Pour les Outils GeoAnalytics, les résultats finaux seront stockés dans le stockage des données spatio-temporelles dans WGS84.

Informations de licence

  • Basic: Requiert ArcGIS GeoAnalytics Server
  • Standard: Requiert ArcGIS GeoAnalytics Server
  • Advanced: Requiert ArcGIS GeoAnalytics Server

Rubriques connexes