Étiquette | Explication | Type de données |
Table en entrée | Table en entrée contenant les champs utilisés pour le calcul des statistiques. | Table View; Raster Layer |
Table en sortie | Table en sortie devant stocker les statistiques calculées. | Table |
Champs de statistiques | Spécifie le ou les champs contenant les valeurs attributaires permettant de calculer les statistiques indiquées. Vous pouvez spécifier plusieurs combinaisons de statistiques et de champs. Les valeurs nulles sont exclues de tous les calculs. Les champs attributaires numériques peuvent être récapitulés à l’aide de toutes les statistiques. Les champs attributaires Texte peuvent être synthétisés avec les statistiques Minimum, Maximum, Total, Premier, Dernier, Unique, Concaténer et Mode. Les champs attributaires Date, Date uniquement et Décalage de l’horodatage peuvent être récapitulés uniquement avec les statistiques Moyenne, Minimum, Maximum, Total, Premier, Dernier, Unique et Concaténer. Les types de statistiques SGBD sont uniquement pris en charge pour les sources de données des géodatabases en entrée, notamment les géodatabases d’entreprise, les services d’entités, les stockages de données cloud et les géodatabases SQLite.
| Value Table |
Champs de récapitulation (Facultatif) | Champs en entrée utilisés pour calculer des statistiques distinctes pour chaque valeur attributaire unique (ou pour chaque combinaison de valeurs attributaires, si plusieurs champs sont spécifiés). | Field |
Séparateur de concaténation (Facultatif) | Un ou plusieurs caractères utilisés pour concaténer des valeurs lorsque l’option Concaténation est utilisée pour le paramètre Champs de statistiques. Par défaut, l’outil concatène les valeurs sans séparateur. | String |
Synthèse
Calcule les résumés statistiques des champs d’une table.
Utilisation
La sortie est constituée de champs contenant le résultat des opérations statistiques.
Cet outil propose les opérations statistiques suivantes : Somme, Moyenne, Maximum, Minimum, Plage, Écart type, Total, Premier, Dernier, Médiane, Variance, Unique, Concaténer et Mode.
Si le paramètre Case Fields (Champ de récapitulation) est spécifié, les statistiques sont calculées pour chaque ensemble unique de valeurs de champ. La table en sortie inclut un enregistrement pour chaque ensemble unique de valeurs de champ. Si le paramètre Case Fields (Champ de récapitulation) n’est pas spécifié, les statistiques sont calculées pour tous les enregistrements en entrée. La table en sortie contient un seul enregistrement.
Le champ Frequency de la sortie est le total de tous les enregistrements en entrée représenté par le jeu l’ensemble unique de valeurs de champ. Si le paramètre Case Fields (Champ de récapitulation) n’est pas spécifié, il s’agit du total de tous les enregistrements en entrée.
Un champ est créé pour chaque type de statistique à l’aide de la convention d’affectation de noms suivante : SUM_<field>, MEAN_<field>, MIN_<field>, MAX_<field>, RANGE_<field>, STD_<field>, COUNT_<field>, FIRST_<field>, LAST_<field>, MEDIAN_<field>, VARIANCE_<field>, UNIQUE_<field>, CONCATENATE_<field>, DBMS_SUM_<field>, DBMS_MEAN_<field>, DBMS_MIN_<field>, DBMS_MAX_<field>, DBMS_STD_<field>, DBMS_COUNT_<field>, DBMS_MEDIAN_<field> et DBMS_VARIANCE_<field> où <field> ( <champ>) est le nom du champ en entrée pour lequel la statistique est calculée. Le nom de champ est tronqué à 10 caractères lorsque la table en sortie est une table dBASE.
Utilisez les types de statistiques SGBD pour traiter les statistiques directement dans la géodatabase ou sur le service et non sur le client. Les types de statistiques SGBD sont uniquement pris en charge pour les sources de données des géodatabases en entrée, notamment les géodatabases d’entreprise, les services d’entités, les stockages de données cloud, GeoPackage et les géodatabases SQLite.
Les types de statistiques SGBD ne prennent pas en charge la sortie dBASE.
Les valeurs nulles sont exclues de tous les calculs statistiques. Par exemple, la moyenne de 6, 4 et d’une valeur nulle est 5 ((6 + 4)/2).
Lors de l’utilisation de couches, seules les entités actuellement sélectionnées sont utilisées pour le calcul des statistiques.
Paramètres
arcpy.analysis.Statistics(in_table, out_table, statistics_fields, {case_field}, {concatenation_separator})
Nom | Explication | Type de données |
in_table | Table en entrée contenant les champs utilisés pour le calcul des statistiques. | Table View; Raster Layer |
out_table | Table en sortie devant stocker les statistiques calculées. | Table |
statistics_fields [[field, {statistic_type}],...] | Spécifie le ou les champs contenant les valeurs attributaires permettant de calculer les statistiques indiquées. Vous pouvez spécifier plusieurs combinaisons de statistiques et de champs. Les valeurs nulles sont exclues de tous les calculs. Les champs attributaires numériques peuvent être récapitulés à l’aide de toutes les statistiques. Les champs attributaires Texte peuvent être synthétisés avec les statistiques Minimum, Maximum, Total, Premier, Dernier, Unique, Concaténer et Mode. Les champs attributaires Date, Date uniquement et Décalage de l’horodatage peuvent être récapitulés uniquement avec les statistiques Moyenne, Minimum, Maximum, Total, Premier, Dernier, Unique et Concaténer. Les types de statistiques SGBD sont uniquement pris en charge pour les sources de données des géodatabases en entrée, notamment les géodatabases d’entreprise, les services d’entités, les stockages de données cloud et les géodatabases SQLite.
| Value Table |
case_field [case_field,...] (Facultatif) | Champs en entrée utilisés pour calculer des statistiques distinctes pour chaque valeur attributaire unique (ou pour chaque combinaison de valeurs attributaires, si plusieurs champs sont spécifiés). | Field |
concatenation_separator (Facultatif) | Un ou plusieurs caractères utilisés pour concaténer des valeurs lorsque l’option CONCATENATION est utilisée pour le paramètre statistics_fields. Par défaut, l’outil concatène les valeurs sans séparateur. | String |
Exemple de code
Le script ci-dessous pour la fenêtre Python montre comment utiliser la fonction Statistics en mode immédiat.
import arcpy
arcpy.env.workspace = "C:/data/Habitat_Analysis.gdb"
arcpy.analysis.Statistics("futrds", "C:/output/output.gdb/stats", [["Shape_Length", "SUM"]], "NM")
Le script autonome ci-dessous indique la végétation par surface à moins de 150 pieds des routes principales.
# Description: Summarize the vegetation by area within 150 feet of major roads.
# Import system modules
import arcpy
# Set environment settings
arcpy.env.workspace = "C:/data"
# Set local variables
inRoads = "majorrds.shp"
outBuffer = "C:/output/output.gdb/buffer_out"
bufferDistance = "250 feet"
inVegetation = "Habitat_Analysis.gdb/vegtype"
outClip = "C:/output/output.gdb/clip_out"
joinField = "HOLLAND95"
joinTable = "c:/data/vegtable.dbf"
joinedField = "HABITAT"
outStatsTable = "C:/output/output.gdb/stats_out"
statsFields = [["Shape_Area", "SUM"]]
# Run Buffer to get a buffer of major roads
arcpy.analysis.Buffer(inRoads, outBuffer, bufferDistance, dissolve_option="ALL")
# Run Clip using the buffer output to get a clipped feature class of
# vegetation
arcpy.analysis.Clip(inVegetation, outBuffer, outClip)
# Run JoinField to add the vegetation type
arcpy.management.JoinField(outClip, joinField, joinTable, joinField, joinedField)
# Run Statistics to get the area of each vegetation type within the
# clipped buffer.
arcpy.analysis.Statistics(outClip, outStatsTable, statsFields, joinedField)
Le script autonome suivant effectue une boucle sur les champs attributaires d’un jeu de données et génère le paramètre statistics_fields de sorte que la statistique SUM soit calculée pour chaque champ numérique.
# Description: Script that runs the Summary Statistics tool to calculate the
# Sum statistic for every numeric field based on a unique case
# field.
# Import system modules
import arcpy
# Set environment settings
arcpy.env.workspace = "C:/data/f.gdb"
# Set local variables
intable = "intable"
outtable = "sumstats"
casefield = "Name"
stats = []
# Loop through all fields in the Input Table
for field in arcpy.ListFields(intable):
# Find the fields that have a numeric type
if field.type in ("Double", "Integer", "Single", "SmallInteger"):
# Add the field name and Sum statistic type to the list of fields to
# summarize
stats.append([field.name, "Sum"])
# Correct formatting of stats [["Field1", "Sum"], ["Field2", "Sum"], ...]
# Run Statistics with the stats list
arcpy.analysis.Statistics(intable, outtable, stats, casefield)
Le script suivant utilise un pandas DataFrame pour accéder aux résultats tabulaires de la fonction Statistics et les afficher.
import arcpy
import pandas
import os
arcpy.env.overwriteOutput = True
in_table = r"d:\data\states.shp"
out_table = r"in_memory\stats_table"
stat_fields = [['POP1990', 'SUM'], ['POP1997', 'SUM']]
stats = arcpy.analysis.Statistics(in_table, out_table, stat_fields,
case_field='SUB_REGION')
# Get a list of field names to display
field_names = [i.name for i in arcpy.ListFields(out_table) if i.type != 'OID']
# Open a cursor to extract results from stats table
cursor = arcpy.da.SearchCursor(out_table, field_names)
# Create a pandas DataFrame to display results
df = pandas.DataFrame(data=[row for row in cursor],
columns=field_names)
print(df)
Environnements
Cas particuliers
- Fuseau horaire
Les statistiques de type Moyenne sur un champ Décalage de l’horodatage utilisent le décalage d’horodatage de cet environnement.
Informations de licence
- Basic: Oui
- Standard: Oui
- Advanced: Oui
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?