Resumen
Calcula las estadísticas de resumen para los campos de una clase de entidad.
Uso
Resumir atributos es una herramienta de análisis tabular, no una herramienta de análisis espacial. Las entradas pueden ser una capa tabular o una capa con geometría (puntos, líneas o polígonos).
Puede especificar uno o más campos por los que resumir, o bien resumir todas las entidades. Cuando se resume por campos, las estadísticas se calculan para cada combinación única de valores de atributos.
La tabla de salida constará de campos que contienen el resultado de la operación estadística.
Se creará un campo para cada tipo de estadística especificado utilizando el siguiente formato de nombre: sum_<field>, max_<field>, min_<field>, range_<field>, std_<field>, count_<field>, var_<field> y any_<field> (donde <field> es el nombre del campo de entrada para el que se calculan las estadísticas). Las estadísticas se calcularán por separado para cada grupo.
Si el tiempo está habilitado en la entrada, puede aplicar los periodos de tiempo al análisis. Cada periodo de tiempo se analiza con independencia de las entidades que quedan fuera de él. Para usar intervalos de tiempo, los datos de entrada deben tener la función de tiempo habilitada y representar un instante en el tiempo. Cuando se aplican intervalos de tiempo, las entidades de salida serán intervalos de tiempo representados por los campos START_DATETIME y END_DATETIME.
Puede aplicar esta herramienta a datos espaciales y obtendrá un resultado tabular. Puede unir los resultados a datos espaciales utilizando Unir entidades.
En las tablas de abajo se ilustran los cálculos estadísticos de una capa que se ha resumido utilizando valores similares de campos. El campo VO2 se utilizó para calcular las estadísticas numéricas (Recuento,Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) para la capa. El campo Rating se utilizó para calcular las estadísticas de cadena de caracteres (Recuento y Cualquiera) para la capa.
La tabla anterior se resumió en el campo Designation y el campo VO2 se utilizó para calcular las estadísticas numéricas (Recuento,Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) para la capa. El campo Rating se utilizó para calcular las estadísticas de cadena de caracteres (Recuento y Cualquiera) para la capa. El resultado es una tabla con dos entidades, que representan los distintos valores de Designation.
En la tabla siguiente se representa el aspecto de los primeros campos cuando la capa se resume con los campos Designation y Age Group. Las estadísticas se calculan utilizando los mismos métodos que en el ejemplo anterior.
Es posible mejorar el rendimiento de la herramienta Resumir atributos gracias a estas sugerencias:
- Defina el entorno de extensión para analizar únicamente datos de interés.
- Utilice datos locales en los que se ejecute el análisis.
Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en su GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.
Al ejecutar herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para su GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Por lo tanto, se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.
Más información acerca del uso compartido de datos en el portal
Más información sobre cómo crear un archivo compartido de Big Data mediante Server Manager
Es posible realizar análisis similares con la herramienta Estadísticas de resumen de la caja de herramientas Análisis.
Sintaxis
arcpy.geoanalytics.SummarizeAttributes(input_layer, output_name, fields, {summary_fields}, {data_store}, {time_step_interval}, {time_step_repeat}, {time_step_reference})
Parámetro | Explicación | Tipo de datos |
input_layer | La capa de punto, polilínea o polígono que se va a resumir. | Record Set |
output_name | El nombre del servicio de entidades de salida. | String |
fields [fields,...] | Uno o varios campos utilizados para resumir entidades similares. Por ejemplo, si elige un único campo denominado PropertyType con los valores comercial y residencial, todos los campos con el valor residencial se resumirán juntos, con las estadísticas de resumen calculadas, y todos los campos con el valor comercial se resumirán juntos. Este ejemplo da como resultado dos filas en la salida, una para los valores de resumen comerciales y otra para los residenciales. | Field |
summary_fields [summary_fields,...] (Opcional) | Las estadísticas que se calcularán en campos concretos.
| Value Table |
data_store (Opcional) | Especifica el ArcGIS Data Store en el que se guardará la salida. La predeterminada es SPATIOTEMPORAL_DATA_STORE. Todos los resultados almacenados en un big data store espaciotemporal se almacenarán en WGS84. Los resultados almacenados en un data store relacional mantendrán su sistema de coordenadas.
| String |
time_step_interval (Opcional) | Un valor que especifica la duración del periodo de tiempo. Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo. Los periodos de tiempo solo se pueden aplicar si el tiempo está habilitado en la entrada. | Time Unit |
time_step_repeat (Opcional) | Un valor que especifica la frecuencia con la que se produce el intervalo del periodo de tiempo. Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo. | Time Unit |
time_step_reference (Opcional) | Una fecha que especifica el tiempo de referencia con el que se alinearán los períodos de tiempo. El valor predeterminado es el 1 de enero de 1970 a las 12:00 AM. Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo. | Date |
Salida derivada
Nombre | Explicación | Tipo de datos |
output | La tabla de salida con atributos resumidos. | Conjunto de registros |
Muestra de código
El siguiente script de la ventana de Python muestra cómo utilizar la herramienta SummarizeAttributes.
#-------------------------------------------------------------------------------
# Name: Summarize Attributes.py
# Description: Summarize Crime Data by year and beat.
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
# This example used a big data file share name "Crimes" with dataset "Chicago" registered on my GeoAnalytics server
inFeatures = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Crimes/BigDataCatalogServer/Chicago"
summaryFields = ["Year", "Beat"]
summaryStatistics = [["Arrest", "COUNT"], ["District", "COUNT"]]
outFS = 'SummarizeCrimes'
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute SummarizeAttributes
arcpy.geoanalytics.SummarizeAttributes(inFeatures, outFS, summaryFields,
summaryStatistics, dataStore)
Entornos
- Sistema de coordenadas de salida
El sistema de coordenadas que se usará para el análisis. El análisis se completará en el sistema de coordenadas de entrada salvo que este parámetro especifique otra opción. Para las GeoAnalytics Tools, los resultados finales se almacenarán en el data store espaciotemporal en WGS84.
Información de licenciamiento
- Basic: Requiere ArcGIS GeoAnalytics Server
- Standard: Requiere ArcGIS GeoAnalytics Server
- Advanced: Requiere ArcGIS GeoAnalytics Server