Synthétiser les attributs (GeoAnalytics)

Synthèse

Calcule les résumés statistiques des champs d'une classe d’entité.

Utilisation

  • L’outil Synthétiser les attributs est un outil d’analyse tabulaire et non un outil d’analyse spatiale. En entrée, vous pouvez utiliser une couche tabulaire ou une couche comportant une géométrie (points, lignes ou polygones).

  • Vous pouvez spécifier un ou plusieurs champs pour effectuer la synthèse ou synthétiser toutes les entités. Dans le premier cas de figure, les statistiques sont calculées pour chaque combinaison unique de valeurs attributaires.

  • La table en sortie est constituée de champs contenant le résultat de l'opération statistique.

  • Un champ est créé pour chaque type de statistique, selon la convention de dénomination suivante : sum_<field>, max_<field>, min_<field>, range_<field>, std_<field>, count_<field>, var_<field> et any_<field> (où <field> est le nom du champ en entrée auquel correspond le calcul statistique). Les statistiques sont calculées séparément sur chaque groupe.

  • Si le temps est activé en entrée, vous pouvez appliquer une discrétisation temporelle à votre analyse. Chaque intervalle temporel est analysé indépendamment des entités en dehors de l’intervalle temporel. Pour que vous puissiez utiliser la discrétisation temporelle, vos données en entrée doivent être temporelles et représenter un instant dans le temps. Lorsque la discrétisation temporelle est appliquée, les entités en sortie sont des intervalles temporels représentés par les champs START_DATETIME et END_DATETIME.

    En savoir plus sur les intervalles temporels

  • Vous pouvez appliquer cet outil à des données spatiales pour obtenir un résultat tabulaire. Vous pouvez joindre vos résultats à des données spatiales à l’aide de l’outil Entités jointes.

  • Les tableaux ci-dessous présentent les calculs statistiques d’une couche synthétisée à l’aide des valeurs identiques de champs. Le champ VO2 a permis de calculer les statistiques numériques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance (Variance)) de la couche. Le champ Rating a permis de calculer les statistiques de chaîne (Count (Total) et Any (Tout)) pour la couche.

    Couche en entrée à synthétiser
    La couche en entrée à synthétiser s’affiche.

    La table ci-dessus a été synthétisée en fonction du champ Designation et le champ VO2 a permis de calculer les statistiques numériques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche. Le champ Rating a permis de calculer les statistiques de chaîne (Count (Total) et Any (Tout)) pour la couche. Il en résulte une table comportant deux entités représentant les valeurs distinctes de Designation.

    Couche en entrée synthétisée avec le champ Designation
    La couche en entrée synthétisée à l’aide du champ Designation s’affiche.

    La table suivante représente les premiers champs lorsque la couche est synthétisée à l’aide des champs Designation et Age Group. Les statistiques sont calculées à l’aide des mêmes méthodes que celles utilisées dans l’exemple précédent.

    Couche en entrée synthétisée à l’aide des champs Designation et Age Group
    La couche en entrée synthétisée à l’aide des champs Designation et Age Group s’affiche.
  • Vous pouvez améliorer les performances de l’outil Summarize Attributes (Synthétiser les attributs) en suivant les conseils ci-après :

    • Définissez l’environnement de l’étendue de manière à analyser uniquement des données d’intérêt.
    • Utilisez les données locales de l’environnement de l’analyse.

  • Cet outil de géotraitement est mis en œuvre par ArcGIS GeoAnalytics Server. L’analyse est réalisée sur le GeoAnalytics Server et les résultats sont stockés dans votre contenu dans ArcGIS Enterprise.

  • Lors de l’exécution des outils GeoAnalytics Server, l’analyse est réalisée sur GeoAnalytics Server. Pour des performances optimales, GeoAnalytics Server doit pouvoir accéder aux données via les couches d’entités hébergées sur votre portail ArcGIS Enterprise ou les partages de fichiers Big Data. Les données qui ne sont pas locales pour GeoAnalytics Server sont transférées sur GeoAnalytics Server avant le début de l’analyse. Autrement dit, l’exécution d’un outil prend plus de temps et, dans certains cas, le transfert des données entre ArcGIS Pro et GeoAnalytics Server peut échouer. Le seuil d’échec dépend aussi bien des débits du réseau que de la taille et de la complexité des données. Il est par conséquent recommandé de toujours partager les données ou créer un partage de fichiers Big Data.

    Pour en savoir plus sur le partage des données dans votre portail.

    Pour en savoir pus sur la création d'un partage de fichiers Big Data via ArcGIS Server Manager

  • Une analyse semblable peut également être réalisée à l’aide de l’outil Résumés statistiques de la boîte d’outils Analyse.

Paramètres

ÉtiquetteExplicationType de données
Couche en entrée

Couche de points, de polylignes ou de polygones à synthétiser.

Record Set
Nom en sortie

Nom du service d'entités en sortie.

String
Champs

Champ ou champs utilisés pour synthétiser des entités similaires. Par exemple, si vous choisissez un seul champ nommé PropertyType avec les valeurs commercial et residential (résidentiel), tous les champs avec la valeur residential (résidentiel) sont synthétisés ensemble (les résumés statistiques sont calculés) et tous les champs avec la valeur commercial sont synthétisés ensemble. Cet exemple génère deux lignes dans la sortie, une pour les valeurs de synthèse commercial, et une autre pour les valeurs de synthèse residential (résidentiel).

Field
Champs de récapitulation
(Facultatif)

Statistiques qui seront calculées sur les champs spécifiés.

Value Table
Stockage des données
(Facultatif)

Indique le ArcGIS Data Store dans laquelle la sortie est enregistrée. La valeur par défaut est Stockage de Big Data spatio-temporelles. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées.

  • Spatiotemporal Big Data StoreLa sortie sera stockée dans un stockage de Big Data spatio-temporelles. Il s’agit de l’option par défaut.
  • Stockage des données relationnellesLa sortie sera stockée dans un data store relationnel.
String
Intervalle temporel
(Facultatif)

Valeur qui spécifie la durée de l'intervalle de temps. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Une discrétisation temporelle peut être appliquée uniquement si le temps est activé sur les données en entrée.

Time Unit
Répétition de l'intervalle temporel
(Facultatif)

Valeur qui spécifie la fréquence à laquelle l'intervalle de temps intervient. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Time Unit
Référence de l'intervalle temporel
(Facultatif)

Une date qui indique l'heure de référence sur laquelle aligner les intervalles temporels. La valeur par défaut est le 1er janvier 1970 à 12 h 00. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Date

Sortie obtenue

ÉtiquetteExplicationType de données
Output

Table en sortie avec des attributs synthétisés.

Jeu d'enregistrements

arcpy.geoanalytics.SummarizeAttributes(input_layer, output_name, fields, {summary_fields}, {data_store}, {time_step_interval}, {time_step_repeat}, {time_step_reference})
NomExplicationType de données
input_layer

Couche de points, de polylignes ou de polygones à synthétiser.

Record Set
output_name

Nom du service d'entités en sortie.

String
fields
[fields,...]

Champ ou champs utilisés pour synthétiser des entités similaires. Par exemple, si vous choisissez un seul champ nommé PropertyType avec les valeurs commercial et residential (résidentiel), tous les champs avec la valeur residential (résidentiel) sont synthétisés ensemble (les résumés statistiques sont calculés) et tous les champs avec la valeur commercial sont synthétisés ensemble. Cet exemple génère deux lignes dans la sortie, une pour les valeurs de synthèse commercial, et une autre pour les valeurs de synthèse residential (résidentiel).

Field
summary_fields
[summary_fields,...]
(Facultatif)

Statistiques qui seront calculées sur les champs spécifiés.

  • COUNT : le nombre de valeurs non nulles. Peut être utilisé sur des champs numériques ou des chaînes. Le nombre de [null, 0, 2] est 2.
  • SUM : somme des valeurs numériques dans un champ. La somme des [null, null, 3] est 3.
  • MEAN : moyenne des valeurs numériques. La moyenne des [0,2, null] est 1.
  • MIN : valeur minimale d’un champ numérique. Le minimum de [0, 2, null] est 0.
  • MAX : valeur maximale d’un champ numérique. La valeur maximale de [0, 2, null] est 2.
  • STDDEV : écart type d’un champ numérique. L'écart type de [1] est null. L'écart type de [null, 1,1,1] est null.
  • VAR : variance d’un champ numérique dans une trace. La variance de [1] est null. La variance de [null, 1,1,1] est null.
  • RANGE : plage d’un champ numérique. Elle est calculée comme la valeur minimale soustraite de la valeur maximale. La plage de [0, null, 1] est 1. La plage de [null, 4] est 0.
  • ANY : exemple de chaîne provenant d’un champ de type chaîne.

Value Table
data_store
(Facultatif)

Indique le ArcGIS Data Store dans laquelle la sortie est enregistrée. La valeur par défaut est SPATIOTEMPORAL_DATA_STORE. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées.

  • SPATIOTEMPORAL_DATA_STORELa sortie sera stockée dans un stockage de Big Data spatio-temporelles. Il s’agit de l’option par défaut.
  • RELATIONAL_DATA_STORELa sortie sera stockée dans un data store relationnel.
String
time_step_interval
(Facultatif)

Valeur qui spécifie la durée de l'intervalle de temps. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Une discrétisation temporelle peut être appliquée uniquement si le temps est activé sur les données en entrée.

Time Unit
time_step_repeat
(Facultatif)

Valeur qui spécifie la fréquence à laquelle l'intervalle de temps intervient. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Time Unit
time_step_reference
(Facultatif)

Une date qui indique l'heure de référence sur laquelle aligner les intervalles temporels. La valeur par défaut est le 1er janvier 1970 à 12 h 00. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Date

Sortie obtenue

NomExplicationType de données
output

Table en sortie avec des attributs synthétisés.

Jeu d'enregistrements

Exemple de code

SummarizeAttributes (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil SummarizeAttributes.

#-------------------------------------------------------------------------------
# Name: Summarize Attributes.py
# Description: Summarize Crime Data by year and beat.
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
# This example used a big data file share name "Crimes" with dataset "Chicago" registered on my GeoAnalytics server
inFeatures = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Crimes/BigDataCatalogServer/Chicago"
summaryFields = ["Year", "Beat"]
summaryStatistics = [["Arrest", "COUNT"], ["District", "COUNT"]]
outFS = 'SummarizeCrimes'
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute SummarizeAttributes
arcpy.geoanalytics.SummarizeAttributes(inFeatures, outFS, summaryFields, 
                                       summaryStatistics, dataStore)

Environnements

Cas particuliers

Système de coordonnées en sortie

Système de coordonnées qui sera utilisé pour l'analyse. L’analyse sera réalisée dans le système de coordonnées en entrée, à moins que ce paramètre en spécifie un autre. Pour les GeoAnalytics Tools, les résultats finaux seront stockés dans le stockage des données spatio-temporelles dans WGS84.

Informations de licence

  • Basic: Nécessite ArcGIS GeoAnalytics Server
  • Standard: Nécessite ArcGIS GeoAnalytics Server
  • Advanced: Nécessite ArcGIS GeoAnalytics Server

Rubriques connexes