Resumir atributos (Geoanálisis)

Resumen

Calcula las estadísticas de resumen para los campos de una clase de entidad.

Uso

  • Resumir atributos es una herramienta de análisis tabular, no una herramienta de análisis espacial. Las entradas pueden ser una capa tabular o una capa con geometría (puntos, líneas o polígonos).

  • Puede especificar uno o más campos por los que resumir, o bien resumir todas las entidades. Cuando se resume por campos, las estadísticas se calculan para cada combinación única de valores de atributos.

  • La tabla de salida constará de campos que contienen el resultado de la operación estadística.

  • Se creará un campo para cada tipo de estadística especificado utilizando el siguiente formato de nombre: sum_<field>, max_<field>, min_<field>, range_<field>, std_<field>, count_<field>, var_<field> y any_<field> (donde <field> es el nombre del campo de entrada para el que se calculan las estadísticas). Las estadísticas se calcularán por separado para cada grupo.

  • Si el tiempo está habilitado en la entrada, puede aplicar los periodos de tiempo al análisis. Cada periodo de tiempo se analiza con independencia de las entidades que quedan fuera de él. Para usar intervalos de tiempo, los datos de entrada deben tener la función de tiempo habilitada y representar un instante en el tiempo. Cuando se aplican intervalos de tiempo, las entidades de salida serán intervalos de tiempo representados por los campos START_DATETIME y END_DATETIME.

    Más información sobre los periodos de tiempo

  • Puede aplicar esta herramienta a datos espaciales y obtendrá un resultado tabular. Puede unir los resultados a datos espaciales utilizando Unir entidades.

  • En las tablas de abajo se ilustran los cálculos estadísticos de una capa que se ha resumido utilizando valores similares de campos. El campo VO2 se utilizó para calcular las estadísticas numéricas (Recuento,Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) para la capa. El campo Rating se utilizó para calcular las estadísticas de cadena de caracteres (Recuento y Cualquiera) para la capa.

    Capa de entrada que se va a resumir
    Se muestra la capa de entrada que se va a resumir.

    La tabla anterior se resumió en el campo Designation y el campo VO2 se utilizó para calcular las estadísticas numéricas (Recuento,Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) para la capa. El campo Rating se utilizó para calcular las estadísticas de cadena de caracteres (Recuento y Cualquiera) para la capa. El resultado es una tabla con dos entidades, que representan los distintos valores de Designation.

    Capa de entrada resumida con el campo Designación
    Se muestra la capa de entrada que se ha resumido utilizando el campo Designación.

    En la tabla siguiente se representa el aspecto de los primeros campos cuando la capa se resume con los campos Designation y Age Group. Las estadísticas se calculan utilizando los mismos métodos que en el ejemplo anterior.

    Capa de entrada resumida utilizando los campos Designación y Grupo de edad
    Se muestra la capa de entrada que se ha resumido utilizando los campos Designación y Grupo de edad.
  • Es posible mejorar el rendimiento de la herramienta Resumir atributos gracias a estas sugerencias:

    • Defina el entorno de extensión para analizar únicamente datos de interés.
    • Utilice datos locales en los que se ejecute el análisis.

  • Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en su GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.

  • Al ejecutar herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para su GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.

    Más información acerca del uso compartido de datos en el portal

    Más información sobre cómo crear un archivo compartido de Big Data mediante Server Manager

  • Es posible realizar análisis similares con la herramienta Estadísticas de resumen de la caja de herramientas Análisis.

Parámetros

EtiquetaExplicaciónTipo de datos
Capa de entrada

La capa de punto, polilínea o polígono que se va a resumir.

Record Set
Nombre de salida

El nombre del servicio de entidades de salida.

String
Campos

Uno o varios campos utilizados para resumir entidades similares. Por ejemplo, si elige un único campo denominado PropertyType con los valores comercial y residencial, todos los campos con el valor residencial se resumirán juntos, con las estadísticas de resumen calculadas, y todos los campos con el valor comercial se resumirán juntos. Este ejemplo da como resultado dos filas en la salida, una para los valores de resumen comerciales y otra para los residenciales.

Field
Campos de resumen
(Opcional)

Las estadísticas que se calcularán en campos concretos.

Value Table
Almacenamiento de datos
(Opcional)

Especifica el ArcGIS Data Store en el que se guardará la salida. Por defecto es big data store espaciotemporal. Todos los resultados almacenados en un big data store espaciotemporal se almacenarán en WGS84. Los resultados almacenados en un data store relacional mantendrán su sistema de coordenadas.

  • Big data store espaciotemporalLa salida se almacenará en un big data store espaciotemporal. Esta es la opción predeterminada.
  • Data store relacionalLa salida se almacenará en un data store relacional.
String
Intervalo de periodo de tiempo
(Opcional)

Un valor que especifica la duración del periodo de tiempo. Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo.

Los periodos de tiempo solo se pueden aplicar si el tiempo está habilitado en la entrada.

Time Unit
Repetición de periodo de tiempo
(Opcional)

Un valor que especifica la frecuencia con la que se produce el intervalo del periodo de tiempo. Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo.

Time Unit
Referencia de periodo de tiempo
(Opcional)

Una fecha que especifica el tiempo de referencia con el que se alinearán los períodos de tiempo. El valor predeterminado es el 1 de enero de 1970 a las 12:00 AM. Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo.

Date

Salida derivada

EtiquetaExplicaciónTipo de datos
Output

La tabla de salida con atributos resumidos.

Conjunto de registros

arcpy.geoanalytics.SummarizeAttributes(input_layer, output_name, fields, {summary_fields}, {data_store}, {time_step_interval}, {time_step_repeat}, {time_step_reference})
NombreExplicaciónTipo de datos
input_layer

La capa de punto, polilínea o polígono que se va a resumir.

Record Set
output_name

El nombre del servicio de entidades de salida.

String
fields
[fields,...]

Uno o varios campos utilizados para resumir entidades similares. Por ejemplo, si elige un único campo denominado PropertyType con los valores comercial y residencial, todos los campos con el valor residencial se resumirán juntos, con las estadísticas de resumen calculadas, y todos los campos con el valor comercial se resumirán juntos. Este ejemplo da como resultado dos filas en la salida, una para los valores de resumen comerciales y otra para los residenciales.

Field
summary_fields
[summary_fields,...]
(Opcional)

Las estadísticas que se calcularán en campos concretos.

  • COUNT: el número de valores no nulos. Se puede usar en campos numéricos o de cadenas de caracteres. El recuento de [null, 0, 2] es 2.
  • SUM: la suma de valores numéricos en un campo. La suma de [null, null, 3] es 3.
  • MEAN: el valor medio de los valores numéricos. El valor medio de [0,2, null] es 1.
  • MIN: el valor mínimo de un campo numérico. El mínimo de [0, 2, null] es 0.
  • MAX: el valor máximo de un campo numérico. El valor máximo de [0, 2, null] es 2.
  • STDDEV: la desviación estándar de un campo numérico. La desviación estándar de [1] es null. La desviación estándar de [null, 1,1,1] es null.
  • VAR: la varianza de un campo numérico en un recorrido. La varianza de [1] es null. La varianza de [null, 1,1,1] es null.
  • RANGE: el rango de un campo numérico. Se calcula como el valor mínimos restado del valor máximo. El rango de [0, null, 1] es 1. El rango de [null, 4] es 0.
  • ANY: una cadena de caracteres de un campo de tipo cadena de caracteres.

Value Table
data_store
(Opcional)

Especifica el ArcGIS Data Store en el que se guardará la salida. El valor predeterminado es SPATIOTEMPORAL_DATA_STORE. Todos los resultados almacenados en un big data store espaciotemporal se almacenarán en WGS84. Los resultados almacenados en un data store relacional mantendrán su sistema de coordenadas.

  • SPATIOTEMPORAL_DATA_STORELa salida se almacenará en un big data store espaciotemporal. Esta es la opción predeterminada.
  • RELATIONAL_DATA_STORELa salida se almacenará en un data store relacional.
String
time_step_interval
(Opcional)

Un valor que especifica la duración del periodo de tiempo. Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo.

Los periodos de tiempo solo se pueden aplicar si el tiempo está habilitado en la entrada.

Time Unit
time_step_repeat
(Opcional)

Un valor que especifica la frecuencia con la que se produce el intervalo del periodo de tiempo. Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo.

Time Unit
time_step_reference
(Opcional)

Una fecha que especifica el tiempo de referencia con el que se alinearán los períodos de tiempo. El valor predeterminado es el 1 de enero de 1970 a las 12:00 AM. Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo.

Date

Salida derivada

NombreExplicaciónTipo de datos
output

La tabla de salida con atributos resumidos.

Conjunto de registros

Muestra de código

SummarizeAttributes (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la herramienta SummarizeAttributes.

#-------------------------------------------------------------------------------
# Name: Summarize Attributes.py
# Description: Summarize Crime Data by year and beat.
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
# This example used a big data file share name "Crimes" with dataset "Chicago" registered on my GeoAnalytics server
inFeatures = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Crimes/BigDataCatalogServer/Chicago"
summaryFields = ["Year", "Beat"]
summaryStatistics = [["Arrest", "COUNT"], ["District", "COUNT"]]
outFS = 'SummarizeCrimes'
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute SummarizeAttributes
arcpy.geoanalytics.SummarizeAttributes(inFeatures, outFS, summaryFields, 
                                       summaryStatistics, dataStore)

Entornos

Casos especiales

Sistema de coordenadas de salida

El sistema de coordenadas que se usará para el análisis. El análisis se completará en el sistema de coordenadas de entrada salvo que este parámetro especifique otra opción. Para GeoAnalytics Tools, los resultados finales se almacenarán en el data store espaciotemporal en WGS84.

Información de licenciamiento

  • Basic: Requiere ArcGIS GeoAnalytics Server
  • Standard: Requiere ArcGIS GeoAnalytics Server
  • Advanced: Requiere ArcGIS GeoAnalytics Server

Temas relacionados