Synthétiser les attributs (GeoAnalytics Desktop)

Synthèse

Calcule les résumés statistiques des champs d'une classe d’entité.

Utilisation

  • L’outil Summarize Attributes (Synthétiser les attributs) est un outil d’analyse tabulaire, et non un outil d’analyse spatiale. En entrée, vous pouvez utiliser une couche tabulaire ou une couche comportant une géométrie (points, lignes ou polygones).

  • Vous pouvez spécifier un ou plusieurs champs pour effectuer la synthèse ou synthétiser toutes les entités. Dans le premier cas de figure, les statistiques sont calculées pour chaque combinaison unique de valeurs attributaires.

  • La table en sortie est constituée de champs contenant le résultat de l'opération statistique.

  • Un champ est créé pour chaque type statistique spécifié à l’aide de la convention d’affectation de noms suivante : sum_<field>, max_<field>, min_<field>, range_<field>, std_<field>, count_<field>, var_<field> et any_<field> (où <field> est le nom du champ en entrée pour lequel la statistique est calculée). Les statistiques sont calculées séparément sur chaque groupe.

  • Vous pouvez appliquer cet outil à des données spatiales pour obtenir un résultat tabulaire. Vous pouvez joindre vos résultats à des données spatiales à l’aide de l’outil Entités jointes.

  • Si le temps est activé dans la sortie, vous pouvez appliquer des intervalles temporels à l’analyse. Chaque intervalle temporel est analysé indépendamment des entités en dehors de l’intervalle temporel. Pour que vous puissiez utiliser la discrétisation temporelle, les données en entrée doivent être temporelles et représenter un instant dans le temps. Lorsque la discrétisation temporelle est appliquée, les entités en sortie sont des intervalles temporels représentés par les champs START_DATETIME et END_DATETIME.

    En savoir plus sur les intervalles temporels

  • Les tableaux ci-dessous présentent les calculs statistiques d’une couche synthétisée à l’aide des valeurs identiques de champs. Le champ VO2 a permis de calculer les statistiques numériques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche. Le champ Rating a permis de calculer les statistiques de chaîne (Count (Total) et Any (Tout)) pour la couche.

    Couche en entrée à synthétiser
    La couche en entrée à synthétiser est affichée.

    Le tableau ci-dessus a été synthétisé en fonction du champ Designation et le champ VO2 a permis de calculer les statistiques numériques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche. Le champ Rating a permis de calculer les statistiques de chaîne (Count (Total) et Any (Tout)) pour la couche. Il en résulte une table avec deux entités représentant les valeurs distinctes de Designation.

    Couche en entrée synthétisée à l’aide du champ Désignation
    La couche en entrée qui a été synthétisée à l’aide du champ Désignation est affichée.

    La table suivante représente les premiers champs lorsque la couche est synthétisée à l’aide des champs Designation et Age Group. Les statistiques sont calculées à l’aide des mêmes méthodes que celles utilisées dans l’exemple précédent.

    Couche en entrée synthétisée à l’aide des champs Désignation et Tranche d’âge
    La couche en entrée qui a été synthétisée à l’aide des champs Désignation et Tranche d’âge est affichée.
  • Vous pouvez améliorer les performances de l’outil Synthétiser les attributs en tenant compte des conseils suivants :

    • Définissez l’environnement d’étendue de manière à n’analyser que les données présentant un intérêt.
    • Utilisez les données locales de l’environnement de l’analyse.

  • Cet outil de géotraitement est mis en œuvre par Spark. L’analyse est effectuée sur votre ordinateur de bureau en utilisant plusieurs cœurs en parallèle. Pour en savoir plus sur l’exécution de l’analyse, reportez-vous à la rubrique Remarques relatives aux outils GeoAnalytics Desktop.

  • Lorsque vous exécutez des outils GeoAnalytics Desktop, l’analyse est effectuée sur votre ordinateur de bureau. Pour des performances optimales, les données doivent être accessibles sur votre bureau. Si vous utilisez une couche d’entités hébergée, il est recommandé d'utiliser ArcGIS GeoAnalytics Server. Si vos données ne sont pas enregistrées en local, l’exécution des outils prendra plus de temps. Pour utiliser votre ArcGIS GeoAnalytics Server en vue d'une analyse, reportez-vous à la rubrique GeoAnalytics Tools.

  • Une analyse similaire peut également être réalisée à l’aide de l’outil Résumés statistiques dans la boîte à outils Analyse.

Paramètres

ÉtiquetteExplicationType de données
Couche en entrée

Couche de points, de polylignes ou de polygones à synthétiser.

Table View
Table en sortie

Nouvelle table avec les attributs synthétisés.

Table
Champs

Champ(s) utilisé(s) pour synthétiser des entités similaires. Par exemple, si vous choisissez un champ unique nommé PropertyType avec les valeurs commerciales et résidentielles, tous les champs de valeurs résidentielles sont synthétisés ensemble (les résumés statistiques sont calculés) et tous les champs de valeurs commerciales sont synthétisés ensemble. Cet exemple génère deux lignes dans la sortie, une pour les valeurs commerciales et une pour les valeurs résidentielles.

Vous pouvez également ne sélectionner aucun champ et récapituler toutes les entités dans un seul résultat de récapitulation.

Field
Champs de récapitulation
(Facultatif)

Statistiques qui seront calculées sur les champs spécifiés.

Value Table
Intervalle temporel
(Facultatif)

Valeur qui spécifie la durée de l'intervalle de temps. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Une discrétisation temporelle peut être appliquée uniquement si le temps est activé sur les données en entrée.

Time Unit
Répétition de l'intervalle temporel
(Facultatif)

Valeur qui spécifie la fréquence à laquelle l'intervalle de temps intervient. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Time Unit
Référence de l'intervalle temporel
(Facultatif)

Une date qui indique l'heure de référence sur laquelle aligner les intervalles temporels. La valeur par défaut est le 1er janvier 1970 à 12 h 00. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Date

arcpy.gapro.SummarizeAttributes(input_layer, out_table, fields, {summary_fields}, {time_step_interval}, {time_step_repeat}, {time_step_reference})
NomExplicationType de données
input_layer

Couche de points, de polylignes ou de polygones à synthétiser.

Table View
out_table

Nouvelle table avec les attributs synthétisés.

Table
fields
[fields,...]

Champ(s) utilisé(s) pour synthétiser des entités similaires. Par exemple, si vous choisissez un champ unique nommé PropertyType avec les valeurs commerciales et résidentielles, tous les champs de valeurs résidentielles sont synthétisés ensemble (les résumés statistiques sont calculés) et tous les champs de valeurs commerciales sont synthétisés ensemble. Cet exemple génère deux lignes dans la sortie, une pour les valeurs commerciales et une pour les valeurs résidentielles.

Vous pouvez également ne sélectionner aucun champ et récapituler toutes les entités dans un seul résultat de récapitulation.

Field
summary_fields
[summary_fields,...]
(Facultatif)

Statistiques qui seront calculées sur les champs spécifiés.

  • COUNT : nombre de valeurs non nulles. Il peut être utilisé sur des champs numériques ou des chaînes. Le nombre de [null, 0, 2] est 2.
  • SUM : somme des valeurs numériques dans un champ. La somme de [null, null, 3] est 3.
  • MEAN : moyenne des valeurs numériques. La moyenne de [0,2, null] est 1.
  • MIN : valeur minimale d’un champ numérique. Le minimum de [0, 2, null] est 0.
  • MAX : valeur maximale d’un champ numérique. La valeur maximale de [0, 2, null] est 2.
  • STDDEV : écart type d’un champ numérique. L’écart type de [1] est null. L’écart type de [null, 1,1,1] est null.
  • VAR : variance d’un champ numérique dans une trace. La variance de [1] est null. La variance de [null, 1,1,1] est null.
  • RANGE : plage d’un champ numérique. Elle est calculée comme la valeur minimale soustraite de la valeur maximale. La plage de [0, null, 1] est 1. La plage de [null, 4] est 0.
  • ANY : exemple de chaîne provenant d’un champ de type chaîne.

Value Table
time_step_interval
(Facultatif)

Valeur qui spécifie la durée de l'intervalle de temps. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Une discrétisation temporelle peut être appliquée uniquement si le temps est activé sur les données en entrée.

Time Unit
time_step_repeat
(Facultatif)

Valeur qui spécifie la fréquence à laquelle l'intervalle de temps intervient. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Time Unit
time_step_reference
(Facultatif)

Une date qui indique l'heure de référence sur laquelle aligner les intervalles temporels. La valeur par défaut est le 1er janvier 1970 à 12 h 00. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

Date

Exemple de code

Exemple d’utilisation de l’outil SummarizeAttributes (script autonome)

Le script autonome ci-dessous illustre l’utilisation de la fonction SummarizeAttributes.


# Name: Summarize Attributes.py
# Description: Summarize Crime Data by year and beat.

# Import system modules
import arcpy

arcpy.env.workspace = "C:/data/CityData.gdb"

# Set local variables
inFeatures = "ChicagoCrimes"
summaryFields = ["Year", "Beat"]
summaryStatistics = [["Arrest", "COUNT"], ["District", "COUNT"]]
out = 'SummarizeCrimes'

# Run SummarizeAttributes
arcpy.gapro.SummarizeAttributes(inFeatures, out, summaryFields, 
                                summaryStatistics)

Informations de licence

  • Basic: Non
  • Standard: Non
  • Advanced: Oui

Rubriques connexes