Synthétiser le centre et la dispersion (GeoAnalytics)

Résumé

Recherche des entités centrales et des distributions directionnelles et calcule les emplacements moyens et médians à partir de l’entrée.

Illustration

Illustration de l’outil Synthétiser le centre et la dispersion

Utilisation

  • Cet outil peut être utilisé pour la centralité et la dispersion des entités. Voici quelques exemples de situations où l’utilisation de cet outil s’avère utile :

    • Une administration locale prévoit d’ouvrir une nouvelle bibliothèque pour une communauté non desservie. Les centroïdes des groupes de blocs avec le zonage approprié et les lots disponibles ont été collectés. Le calcul d’une entité centrale avec une pondération sur la population peut être utilisé pour identifier le groupe de blocs central qui servira au mieux la communauté.
    • Un analyste SIG analyse les emplacements des appels 911 et ceux des postes d’intervention d’urgence (police, pompiers et ambulances). Un résultat de centre moyen permet de comparer le centre moyen des appels d’urgence au centre moyen des postes d’intervention afin d’optimiser le temps de réponse.
    • Un analyste de la criminalité souhaite déterminer si le centre médian des cambriolages se déplace lors de l’évaluation des incidents de jour et de nuit. Le calcul d’un centre médian avec un groupe par heure de la journée permet de déterminer où sont commis les délits au cours de la journée et de la nuit.
    • Un analyste SIG d’une organisation non gouvernementale analyse la propagation d’une maladie infectieuse. Une ellipse peut être utilisée pour modéliser la propagation de l’épidémie.

  • Pour les entités linéaires et surfaciques en entrée, les centroïdes d'entité sont utilisés dans les calculs de distance.

  • Le paramètre Champ de pondération permet de pondérer les emplacements en fonction de leur importance relative. Il est par exemple possible de pondérer les magasins d’une grande chaîne par rapport au total des ventes, ou les entités surfaciques par rapport à leur surface. Reportez-vous à la section Application des pondérations pour plus d'informations sur la façon dont les pondérations sont appliquées dans l’analyse.

  • Le paramètre Regrouper par champ permet de regrouper les entités pour des calculs distincts des entités centrales ou de la dispersion. Par exemple, les observations de la faune tout au long de l’année peuvent être regroupées par saison ou par mois. Ce champ peut être de type entier, date ou chaîne. Les enregistrements comportant des valeurs nulles seront regroupés ensemble.

  • L’entité centrale est l’entité associée à la plus petite distance cumulée vers toutes les autres entités du jeu de données. Cette entité est identifiée et incluse dans la sortie Couche d’entités centrales. Plusieurs entités peuvent partager la plus petite distance cumulée vers toutes les autres entités. Lorsque c’est le cas, toutes les entités les plus centrales sont incluses dans la sortie Central Feature Layer (Couche d’entités centrales). Lorsqu'une valeur de paramètre Group By Field (Grouper par champ) est spécifiée, les entités en entrée sont groupées en premier selon les valeurs du champ ; une entité centrale est ensuite identifiée pour chaque groupe. L’entité centrale en sortie doit avoir le même type de géométrie que les entités en entrée.

  • Le centre moyen est un point construit à partir des coordonnées x et y moyennes. Les entités de centre moyen sont incluses dans la sortie Mean Center Layer (Couche de centre moyen). Lorsqu'une valeur Group By Field (Grouper par champ) est spécifiée, les entités en entrée sont groupées en premier selon les valeurs du champ ; le centre moyen est ensuite calculé pour chaque groupe.

  • Le centre médian utilise un algorithme itératif pour identifier le point géométrique médian qui minimise la distance euclidienne vers toutes les entités du jeu de données. Les entités de centre médian sont incluses dans la sortie Median Center Layer (Couche de centre médian). Lorsqu'une valeur Group By Field (Grouper par champ) est spécifiée, les entités en entrée sont groupées en premier selon les valeurs du champ ; le centre médian est ensuite calculé pour chaque groupe. Contrairement aux résultats de l’opération de centre moyen, les résultats de l’opération de centre médian sont moins influencés par les entités aberrantes.

  • Des ellipses d'écart type sont créées pour récapituler les caractéristiques spatiales des entités géographiques : tendance centrale, dispersion et tendances directionnelles. Les ellipses peuvent être dimensionnées en 1, 2 ou 3 écarts types. Les entités ellipses sont incluses dans la sortie Ellipse Layer (Couche d’ellipses). Lorsqu'une valeur Group By Field (Grouper par champ) est spécifiée, les entités en entrée sont groupées en premier selon les valeurs du champ ; une ellipse est ensuite calculée pour chaque groupe.

  • Vous pouvez spécifier un ou plusieurs types de résumés à générer. Chaque type de résumé sera généré dans une couche d’entités unique.

  • Si la couche en entrée comporte des entités ayant des valeurs de temps ou de géométrie nulles, ces entités ne seront pas utilisées dans l’analyse.

  • Outre les champs provenant de la couche en entrée, les champs suivants seront inclus dans le résultat du type récapitulatif Entité centrale en sortie :

    Nom du champDescription

    CoordX

    Coordonnée x de l’entité centrale. Si l’entité est une ligne ou un polygone, la valeur représentera le centroïde de l’entité.

    CoordY

    Coordonnée y de l’entité centrale. Si l’entité est une ligne ou un polygone, la valeur représentera le centroïde de l’entité.

    instant_datetime

    Si la couche en entrée est temporelle avec un temps de type instant, le résultat en sortie inclura un champ de date de type instant représentant l’heure de l’entité en sortie.

    start_datetime

    Si la couche en entrée est temporelle avec un temps de type intervalle, le résultat en sortie inclura un champ de date de début représentant l’heure de début de l’entité en sortie.

    end_datetime

    Si la couche en entrée est temporelle avec un temps de type intervalles, le résultat en sortie inclura un champ de date de fin instant représentant l’heure de fin de l’entité en sortie.

  • Outre la valeur du paramètre facultatif Grouper par champ utilisée dans l’analyse, les champs suivants seront inclus dans les résultats des types récapitulatifs Centre moyen et Centre médian en sortie :

    Nom du champDescription

    CoordX

    Coordonnée x de l’entité médiane ou moyenne.

    CoordY

    Coordonnée y de l’entité médiane ou moyenne.

    instant_datetime

    Si la couche en entrée est temporelle, le résultat en sortie inclura un champ de date de type instant représentant l’heure moyenne ou médianne des entités en entrée. Ceci s’applique aux couches en entrée des types intervalle et instant.

  • Outre la valeur du paramètre facultatif Grouper par champ utilisée dans l’analyse, les champs suivants seront inclus dans le type de résumé Ellipse en sortie :

    Nom du champDescription

    CenterX

    Coordonnée x du centre moyen de l’ellipse.

    CenterY

    Coordonnée y du centre moyen de l’ellipse.

    CenterT

    Valeur temporelle du centre moyen de l’ellipse.

    Rotation

    Rotation de l'axe long mesurée dans le sens horaire à partir de midi. La rotation est mesurée dans les unités de la référence spatiale en entrée. Par exemple, un jeu de données projetées pourrait être mesuré en mètres, et un jeu de données géographiques pourrait être mesuré en degrés.

    MajStdDist

    La distance standard du grand axe. La rotation est mesurée dans les unités de la référence spatiale en entrée. Par exemple, un jeu de données avec une référence spatiale projetée pourrait être mesuré en mètres, et un jeu de données avec une référence spatiale géographique pourrait être mesuré en degrés

    MinStdDist

    La distance standard du petit axe. La rotation est mesurée dans les unités de la référence spatiale en entrée. Par exemple, un jeu de données avec une référence spatiale projetée pourrait être mesuré en mètres, et un jeu de données avec une référence spatiale géographique pourrait être mesuré en degrés

    TmStdDist

    La distance temporelle standard. Cette valeur est une durée mesurée en millisecondes.

  • Les attributs des valeurs des coordonnées, par exemple CoordX et CoordYseront calculés à l’aide de la référence spatiale de l’analyse. Par défaut, la référence spatiale de l’analyse est la même que celle de la couche en entrée. Vous pouvez éventuellement spécifier la référence spatiale utilisée dans l’analyse à l’aide de la variable d'environnement du système de coordonnées en sortie.

    Si vous écrivez les résultats dans le répertoire de données temporelles, les entités de résultats seront représentées par le système de coordonnées WGS 1984 (WKID 4326). Ce qui signifie que les valeurs géométriques de vos entités de résultats peuvent être stockées dans des systèmes de coordonnées différents de celui des valeurs attributaires en sortie. Par exemple, si vous générez en sortie une couche de centre moyen dans le répertoire de données spatiotemporelles et que vous spécifiez comme valeur d’environnement du système de coordonnées en sortie NAD 1983 UTM Zone 1N (WKID 26901), les valeurs calculées pour les champs CoordXet CoordY se trouveront dans le système NAD 1983 UTM Zone 1N (WKID 26901), tandis que les entités sur la carte seront dans le système de coordonnées WGS 1984 (WKID 4326).

  • Vous pouvez améliorer les performances de l’outil Synthétiser le centre et la dispersion en suivant les conseils ci-après :

    • Définissez l’environnement de l’étendue de manière à analyser uniquement des données d’intérêt.
    • Utilisez les données locales de l’environnement de l’analyse.
    • Groupez vos données à l’aide du paramètre Group By Field (Grouper par champ).
    • Pour les jeux de données plus volumineux, utilisez lCentre médian pour le paramètre Générer des types, car celui-ci peut s’avérer le moins performant en raison de ses calculs itératifs.

  • Cet outil de géotraitement est mis en œuvre par ArcGIS GeoAnalytics Server. L’analyse est réalisée sur le GeoAnalytics Server et les résultats sont stockés dans votre contenu dans ArcGIS Enterprise.

  • Lors de l’exécution des outils GeoAnalytics Server, l’analyse est réalisée sur GeoAnalytics Server. Pour des performances optimales, GeoAnalytics Server doit pouvoir accéder aux données via les couches d’entités hébergées sur votre portail ArcGIS Enterprise ou les partages de fichiers Big Data. Les données qui ne sont pas locales pour GeoAnalytics Server sont transférées sur GeoAnalytics Server avant le début de l’analyse. Autrement dit, l’exécution d’un outil prend plus de temps et, dans certains cas, le transfert des données entre ArcGIS Pro et GeoAnalytics Server peut échouer. Le seuil d’échec dépend aussi bien des débits du réseau que de la taille et de la complexité des données. Il est par conséquent recommandé de toujours partager les données ou créer un partage de fichiers Big Data.

    Pour en savoir plus sur le partage des données dans votre portail.

    Pour en savoir pus sur la création d'un partage de fichiers Big Data via ArcGIS Server Manager

Paramètres

ÉtiquetteExplicationType de données
Couche en entrée

Couche ponctuelle, linéaire ou surfacique à synthétiser.

Feature Set
Nom en sortie

Nom du service d'entités en sortie.

String
Générer des types

Spécifie les types de résumés à générer. Vous pouvez utiliser un ou plusieurs types de résumés. Une couche unique sera créée pour chaque type de résumé sélectionné.

  • Entité centrale —Une couche sera créée contenant une copie de l’entité la plus centrale dans la couche en entrée.
  • Centre moyen —Une couche de points sera créée représentant le centre moyen de la couche en entrée.
  • Centre médian —Une couche de points sera créée représentant le centre médian de la couche en entrée.
  • Ellipse —Une couche de polygones sera créée représentant l’ellipse directionnelle de la couche en entrée.
String
Taille de l'ellipse
(Facultatif)

Spécifie la taille des ellipses en sortie en écarts types.

  • Un écart type —Les ellipses en sortie couvriront un écart type des entités en entrée. Il s’agit de l’option par défaut.
  • Deux écarts types —Les ellipses en sortie couvriront deux écarts types des entités en entrée.
  • Trois écarts types —Les ellipses en sortie couvriront trois écarts types des entités en entrée.
String
Champ de pondération
(Facultatif)

Champ numérique permettant de pondérer les emplacements en fonction de leur importance relative. Ceci s'applique à tous les types de résumés.

Field
Grouper par champ
(Facultatif)

Champ utilisé pour regrouper des entités similaires. Ceci s'applique à tous les types de résumés. Par exemple, si vous choisissez un champ nommé PlantTypecontenant des valeurs liées aux arbres, buissons et herbages, toutes les entités avec la valeur arbre seront analysées pour leur propre centre ou dispersion. Cet exemple aura pour résultat trois entités, une pour chaque groupe d’arbres, de buissons et d’herbages.

Field
Data Store
(Facultatif)

Indique le ArcGIS Data Store dans laquelle la sortie est enregistrée. La valeur par défaut est Stockage de Big Data spatio-temporelles. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées.

  • Spatiotemporal Big Data Store —La sortie sera stockée dans un stockage de Big Data spatio-temporelles. Il s’agit de l’option par défaut.
  • Stockage des données relationnelles —La sortie sera stockée dans un data store relationnel.
String

Sortie dérivée

ÉtiquetteExplicationType de données
Couche d’entité centrale

La couche contenant l’entité centrale provenant de la couche en entrée.

Feature Class
Couche de centre moyen

La couche de points contenant les représentations de centre moyen de la couche en entrée.

Feature Class
Couche de centre médian

La couche de points contenant les représentations de centre médian de la couche en entrée.

Feature Class
Couche d’ellipse

La couche de polygones contenant les représentations d’ellipse de la couche en entrée.

Feature Class

arcpy.geoanalytics.SummarizeCenterAndDispersion(input_layer, output_name, generate_types, {ellipse_size}, {weight_field}, {group_by_field}, {data_store})
NomExplicationType de données
input_layer

Couche ponctuelle, linéaire ou surfacique à synthétiser.

Feature Set
output_name

Nom du service d'entités en sortie.

String
generate_types
[generate_types,...]

Spécifie les types de résumés à générer. Vous pouvez utiliser un ou plusieurs types de résumés. Une couche unique sera créée pour chaque type de résumé sélectionné.

  • CENTRAL_FEATUREUne couche sera créée contenant une copie de l’entité la plus centrale dans la couche en entrée.
  • MEAN_CENTERUne couche de points sera créée représentant le centre moyen de la couche en entrée.
  • MEDIAN_CENTERUne couche de points sera créée représentant le centre médian de la couche en entrée.
  • ELLIPSEUne couche de polygones sera créée représentant l’ellipse directionnelle de la couche en entrée.
String
ellipse_size
(Facultatif)

Spécifie la taille des ellipses en sortie en écarts types.

  • 1_STANDARD_DEVIATIONLes ellipses en sortie couvriront un écart type des entités en entrée. Il s’agit de l’option par défaut.
  • 2_STANDARD_DEVIATIONSLes ellipses en sortie couvriront deux écarts types des entités en entrée.
  • 3_STANDARD_DEVIATIONSLes ellipses en sortie couvriront trois écarts types des entités en entrée.
String
weight_field
(Facultatif)

Champ numérique permettant de pondérer les emplacements en fonction de leur importance relative. Ceci s'applique à tous les types de résumés.

Field
group_by_field
(Facultatif)

Champ utilisé pour regrouper des entités similaires. Ceci s'applique à tous les types de résumés. Par exemple, si vous choisissez un champ nommé PlantTypecontenant des valeurs liées aux arbres, buissons et herbages, toutes les entités avec la valeur arbre seront analysées pour leur propre centre ou dispersion. Cet exemple aura pour résultat trois entités, une pour chaque groupe d’arbres, de buissons et d’herbages.

Field
data_store
(Facultatif)

Indique le ArcGIS Data Store dans laquelle la sortie est enregistrée. La valeur par défaut est SPATIOTEMPORAL_DATA_STORE. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées.

  • SPATIOTEMPORAL_DATA_STORELa sortie sera stockée dans un stockage de Big Data spatio-temporelles. Il s’agit de l’option par défaut.
  • RELATIONAL_DATA_STORELa sortie sera stockée dans un data store relationnel.
String

Sortie dérivée

NomExplicationType de données
out_central_feature_layer

La couche contenant l’entité centrale provenant de la couche en entrée.

Feature Class
out_mean_center_layer

La couche de points contenant les représentations de centre moyen de la couche en entrée.

Feature Class
out_median_center_layer

La couche de points contenant les représentations de centre médian de la couche en entrée.

Feature Class
out_ellipse_layer

La couche de polygones contenant les représentations d’ellipse de la couche en entrée.

Feature Class

Exemple de code

SummarizeCenterAndDispersion (script autonome)

Le script autonome ci-dessous illustre l’utilisation de la fonction SummarizeCenterAndDispersion.

# Name: SummarizeCenterAndDispersion.py
# Description: Calculate a standard deviational ellipse of contagious disease 
#              data to understand the spread of the disease over time. 
#
# Requirements: ArcGIS GeoAnalytics Server

# Import system modules
import arcpy

# Set local variables
# This example calculates a standard deviational ellipse for three standard 
# deviations of the data
inFeatures = "https://sampleserver6.com/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_myBDFS/BigDataCatalogServer/diseaseRecords"
outFS = "disease_movement_ellipse"
summaryType = "ELLIPSE"
dataStore = "RELATIONAL_DATA_STORE"

# Execute SummarizeCenterAndDispersion
arcpy.geoanalytics.SummarizeCenterAndDispersion(inFeatures, outFS, summaryType, 
                                                "3_STANDARD_DEVIATIONS", "", 
                                                "", "", "", "" dataStore)

Environnements

Système de coordonnées en sortie

Système de coordonnées qui sera utilisé pour l'analyse. L’analyse sera réalisée dans le système de coordonnées en entrée, à moins que ce paramètre en spécifie un autre. Pour les GeoAnalytics Tools, les résultats finaux seront stockés dans le stockage des données spatio-temporelles dans WGS84.

Informations de licence

  • Basic: Nécessite ArcGIS GeoAnalytics Server
  • Standard: Nécessite ArcGIS GeoAnalytics Server
  • Advanced: Nécessite ArcGIS GeoAnalytics Server

Rubriques connexes