De estadísticas de campo a tabla (Administración de datos)

Resumen

Crea una tabla de estadísticas descriptivas para uno o más campos de entrada en una tabla o clase de entidad.

Ilustración

Ilustración de la herramienta Estadísticas de campo a tabla

Uso

  • La herramienta acepta una clase de entidad o tabla independiente como entrada.

  • Para el parámetro Campos de entrada, se pueden especificar varios campos para los que se pueden calcular las estadísticas. El parámetro acepta campos de tipo numérico (corto, largo, entero grande, flotante y doble), texto y fecha (fecha, solo fecha, solo hora y desfase de marca de tiempo).

  • El orden de los campos especificados por el parámetro Campos de entrada será el orden de las filas en la tabla de salida.

  • El parámetro Agrupar por campo se utiliza para calcular las estadísticas de campo de entrada por separado para cada valor único en el campo especificado. Se calcularán las estadísticas para cada uno de los campos de entrada una vez por valor único en Agrupar por campo.

  • El parámetro Tablas de salida tiene cuatro opciones para la columna Tipos de campos:

    • Todos: todos los campos de entrada y estadísticas de salida, independientemente del tipo de campo, se exportarán a una única tabla de salida.
    • Numérico: solo se exportarán los campos de entrada de tipo Numérico (Corto, Largo, Entero grande, Flotante y Doble) y solo se exportarán a la tabla de salida las estadísticas aplicables a los tipos de campos Numérico.
    • Texto: solo se exportarán los campos de entrada de tipo Texto y solo se exportarán a la tabla de salida las estadísticas aplicables al tipo de campo Texto.
    • Fecha: solo se exportarán los campos de entrada de tipo Fecha (Fecha, Solo fecha, Solo hora y Desfase de marca de tiempo) y solo se exportarán a la tabla de salida las estadísticas aplicables al tipo de campo Fecha.

    Para cada tabla de salida, el nombre de la tabla se especifica en la columna Nombre de salida del parámetro Tablas de salida y la tabla se guardará en el espacio de trabajo especificado por el parámetro Ubicación de salida.

  • Las estadísticas de salida y sus nombres de campo se pueden configurar con el parámetro Estadísticas de salida. Si no se proporciona ningún valor para este parámetro, todas las estadísticas de salida aplicables se incluirán en las tablas de salida. La siguiente tabla enumera las estadísticas disponibles y el tipo de campo de salida correspondiente para cada opción de la columna Tipos de campo del parámetro Tablas de salida:

    Estadística de salidaTodasNuméricoTextoFecha

    Nombre de campo

    Texto

    Texto

    Texto

    Texto

    Alias

    Texto

    Texto

    Texto

    Texto

    Tipo de campo

    Texto

    Texto

    Texto

    Texto

    Nulos

    Largo

    Largo

    Largo

    Largo

    Mínimo

    Texto

    Doble

    -

    Fecha

    Máximo

    Texto

    Doble

    -

    Fecha

    Valor medio

    Texto

    Doble

    -

    Fecha

    Desviación estándar

    Doble

    Doble

    -

    -

    Mediana

    Texto

    Doble

    -

    Fecha

    Recuento

    Largo

    Largo

    Largo

    Largo

    Número de valores únicos

    Largo

    Largo

    Largo

    Largo

    Modo

    Texto

    Doble

    Texto

    Fecha

    Menos común

    Texto

    Doble

    Texto

    Fecha

    Valores atípicos

    Largo

    Largo

    -

    -

    Suma

    Doble

    Doble

    -

    -

    Rango

    Texto

    Doble

    -

    Texto

    Rango intercuartílico

    Doble

    Doble

    -

    -

    Primer cuartil

    Texto

    Doble

    -

    Fecha

    Tercer cuartil

    Texto

    Doble

    -

    Fecha

    Coeficiente de variación

    Doble

    Doble

    -

    -

    Sesgo

    Doble

    Doble

    -

    -

    Curtosis

    Doble

    Doble

    -

    -

  • Las estadísticas disponibles son las mismas que las disponibles en la vista Ingeniería de datos. Para obtener detalles sobre cómo se calcula cada estadística, consulte Interactuar con estadísticas.

  • Si elige Todos para la columna Tipos de campo del parámetro Tablas de salida, todos los tipos de campo se exportarán en una única tabla. Esto puede ayudarle a visualizar todos los campos de entrada y sus estadísticas a la vez. Esto ofrece ventajas para ciertas aplicaciones; por ejemplo, es posible que sea preferible al utilizar las estadísticas en un diseño o un informe. Sin embargo, existen advertencias a la hora de exportar diferentes tipos de campos como una única tabla. Algunas opciones estadísticas que son comunes en los tipos de campo, incluidas Modo, Menos común, Mínimo y Máximo, se almacenarán como campos de texto en la tabla de salida. Esto puede causar problemas, por ejemplo, al ordenar estos valores en las columnas de estadísticas o al encadenar las estadísticas de salida en un modelo. También habrá celdas vacías en la tabla, ya que ciertas estadísticas no se aplican a los campos de texto o fecha.

  • Si elige Numérico, Texto o Fecha para la columna Tipos de campo del parámetro Tablas de salida, cada tipo de campo se exportará en una tabla separada y las tablas de salida solo incluirán las estadísticas aplicables a ese tipo de campo. Algunas estadísticas que se aplican a varios tipos de campo se almacenarán en el formato que coincida con el tipo de campo de entrada. Por ejemplo, en la tabla Numérico, el campo Mínimo será de tipo Doble y será del tipo Fecha en la tabla Fecha. Se recomienda que tenga diferentes tablas de salida. Por ejemplo, para guardar las estadísticas como el mismo tipo que los campos de entrada, ordene las estadísticas en la tabla de salida o utilice sus valores en un modelo.

  • Las opciones Modo y Menos común para la columna Estadística del parámetro Estadísticas de salida pueden corresponder a varios valores de un campo de entrada en el caso de un empate. En estos casos, se informarán varios valores como <Null> para las tablas de salida Numérico, Texto y Fecha. Para la opción Todo, la celda de salida contendrá el texto Varios valores.

Parámetros

EtiquetaExplicaciónTipo de datos
Tabla de entrada

La tabla de entrada que contiene los campos que se utilizarán para calcular la tabla de estadísticas.

Table View
Campos de entrada

Los campos que contienen los valores que se utilizarán para calcular las estadísticas.

Field
Localización de salida

La ubicación en la que se crearán las tablas de salida. La ubicación puede ser una geodatabase, una carpeta o un dataset de entidades.

Workspace
Tablas de salida

Las tablas de salida que contienen las estadísticas. La columna Tipos de campos especifica los tipos de campo que se incluirán en cada tabla de salida y el nombre de cada tabla de salida se proporciona en la columna Nombre de salida. Por ejemplo, puede crear una única tabla con resúmenes de todos los tipos de campo, o puede crear tablas separadas para resúmenes de tipos de campo Numérico, Texto y Fecha.

Las siguientes opciones están disponibles para la columna Tipos de campos:

  • Numérico: se creará una tabla que resume los campos numéricos de la entrada (tipos Corto, Largo, Entero grande, Flotante y Doble).
  • Texto: se creará una tabla que resume los campos de texto de la entrada (tipo Texto).
  • Fecha: se creará una tabla que resume los campos de fecha de la entrada (tipos Fecha, Solo fecha, Solo hora y Desfase de marca de tiempo).
  • Todo: se creará una tabla que resume todos los campos numéricos, de texto y de fecha de la entrada. Los campos de salida que contienen estadísticas que se aplican a varios tipos de campos se guardarán como tipo Texto. Las estadísticas de salida que no se aplican a los campos de tipo Texto y Fecha estarán vacías.

Value Table
Agrupar por campo
(Opcional)

El campo que se utilizará para agrupar filas en categorías. Si se proporciona Agrupar por campo, cada campo de la entrada aparecerá como una fila en la tabla de salida una vez por valor único de Agrupar por campo.

Field
Estadísticas de salida
(Opcional)

Especifica las estadísticas que se resumirán y los nombres de los campos de salida que contienen las estadísticas. La estadística se proporciona en la columna Estadística y el nombre del campo de salida se proporciona en la columna Nombre de campo de salida. Si no se proporcionan valores, se calcularán todas las estadísticas aplicables para todos los campos de entrada.

Las siguientes opciones están disponibles para la columna Estadística (solo estarán disponibles las estadísticas aplicables a los campos de entrada):

  • Nombre del campo: el nombre del campo.
  • Alias: el alias del campo.
  • Tipo de campo: el tipo de campo del campo (Corto, Largo, Doble, Flotante, Texto o Fecha).
  • Nulos: el número de registros que contienen valores nulos del campo.
  • Mínimo: el valor más bajo del campo.
  • Máximo: el valor más alto del campo.
  • Valor medio: el valor medio (suma dividida por el recuento total) de todos los valores del campo. Para calcular la fecha media de los campos de fecha, cada fecha se convierte en un número mediante el cálculo de la diferencia entre la fecha y una fecha de referencia (por ejemplo, 1900-01-01), calculada en milisegundos.
  • Desviación estándar: la desviación estándar de los valores del campo. Se calcula como la raíz cuadrada de la varianza, en la que la varianza es el promedio de la diferencia al cuadrado de cada valor con respecto al valor medio del campo.
  • Mediana: la mediana de todos los valores del campo. El valor mediano es el valor central de la lista ordenada de valores. Si hay un número par de valores, la mediana es el valor medio entre los dos valores centrales de la distribución.
  • Recuento: el número de valores no nulos del campo.
  • Número de valores únicos: el número de valores únicos del campo.
  • Modo: el valor que más aparece en el campo.
  • Menos común: el valor menos común del campo.
  • Valores atípicos: el número de registros con valores atípicos del campo. Los valores atípicos son aquellos que superan en más de 1,5 veces el rango intercuartil por encima del tercer cuartil o por debajo del primer cuartil de los valores del campo.
  • Suma: la suma de todos los valores del campo.
  • Rango: la diferencia entre el valor más pequeño y el más grande del campo.
  • Rango intercuartil: el rango entre el primer cuartil y el tercer cuartil de los valores del campo. Representa el rango de la mitad centro de los datos.
  • Primer cuartil: el valor del primer cuartil del campo. Los cuartiles dividen la lista ordenada de valores en cuatro grupos que contienen igual número de valores. El primer cuartil es el límite superior del primer grupo en orden ascendente.
  • Tercer cuartil: el valor del tercer cuartil del campo. Los cuartiles dividen la lista ordenada de valores en cuatro grupos que contienen igual número de valores. El tercer cuartil es el límite superior del tercer grupo en orden ascendente.
  • Coeficiente de variación: el coeficiente de variación de los valores del campo. El coeficiente de variación es una medida de la propagación relativa de los valores. Se calcula como la desviación estándar dividida por el valor medio del campo.
  • Sesgo: el sesgo de los valores del campo. El sesgo mide la simetría de la distribución. El sesgo se calcula como el tercer momento (la media de los valores de los datos al cubo) dividido por la desviación estándar al cubo.
  • Curtosis: la curtosis de los valores del campo. La curtosis describe el peso de las colas de una distribución en comparación con la distribución normal, lo que ayuda a identificar la frecuencia de los valores extremos. La curtosis se calcula como el cuarto momento (el promedio de los valores de los datos elevados a la cuarta potencia) dividido por la cuarta potencia de la desviación estándar.

Value Table

Salida derivada

EtiquetaExplicaciónTipo de datos
Tabla de salida para campos numéricos

Las tablas de salida para los tipos de datos Numérico. La tabla se guardará en el espacio de trabajo especificado en el parámetro Ubicación de salida.

Table
Tabla de salida para campos de texto

Las tablas de salida para los tipos de datos Texto. La tabla se guardará en el espacio de trabajo especificado en el parámetro Ubicación de salida.

Table
Tabla de salida para campos de fecha

Las tablas de salida para los tipos de datos Fecha. La tabla se guardará en el espacio de trabajo especificado en el parámetro Ubicación de salida.

Table
Tabla de salida para todos los campos

Las tablas de salida para todos los tipos de datos. La tabla se guardará en el espacio de trabajo especificado en el parámetro Ubicación de salida.

Table

arcpy.management.FieldStatisticsToTable(in_table, in_fields, out_location, out_tables, {group_by_field}, {out_statistics})
NombreExplicaciónTipo de datos
in_table

La tabla de entrada que contiene los campos que se utilizarán para calcular la tabla de estadísticas.

Table View
in_fields
[in_fields,...]

Los campos que contienen los valores que se utilizarán para calcular las estadísticas.

Field
out_location

La ubicación en la que se crearán las tablas de salida. La ubicación puede ser una geodatabase, una carpeta o un dataset de entidades.

Workspace
out_tables
[[field_type, output_name],...]

Las tablas de salida que contienen las estadísticas. La columna field_type especifica los tipos de campo que se incluirán en cada tabla de salida y el nombre de cada tabla de salida se proporciona en la columna output_name. Por ejemplo, puede crear una única tabla con resúmenes de todos los tipos de campo, o puede crear tablas separadas para resúmenes de tipos de campo Numérico, Texto y Fecha.

Las siguientes opciones están disponibles para la columna field_type:

  • NUMERIC: se creará una tabla que resume los campos numéricos de la entrada (tipos Corto, Largo, Entero grande, Flotante y Doble).
  • TEXT: se creará una tabla que resume los campos de texto de la entrada (tipo Texto).
  • DATE: se creará una tabla que resume los campos de fecha de la entrada (tipos Fecha, Solo fecha, Solo hora y Desfase de marca de tiempo).
  • ALL: se creará una tabla que resume todos los campos numéricos, de texto y de fecha de la entrada. Los campos de salida que contienen estadísticas que se aplican a varios tipos de campos se guardarán como tipo Texto. Las estadísticas de salida que no se aplican a los campos de tipo Texto y Fecha estarán vacías.

Value Table
group_by_field
(Opcional)

El campo que se utilizará para agrupar filas en categorías. Si se proporciona Agrupar por campo, cada campo de la entrada aparecerá como una fila en la tabla de salida una vez por valor único de Agrupar por campo.

Field
out_statistics
[[out_statistic, output_name],...]
(Opcional)

Especifica las estadísticas que se resumirán y los nombres de los campos de salida que contienen las estadísticas. La estadística se proporciona en la columna out_statistic y el nombre del campo de salida se proporciona en la columna output_name. Si no se proporcionan valores, se calcularán todas las estadísticas aplicables para todos los campos de entrada.

Las siguientes opciones están disponibles para la columna out_statistic (solo estarán disponibles las estadísticas aplicables a los campos de entrada):

  • FIELDNAME: el nombre del campo.
  • ALIAS: el alias del campo.
  • FIELDTYPE: el tipo de campo del campo (Corto, Largo, Doble, Flotante, Texto o Fecha).
  • NULLS: el número de registros que contienen valores nulos del campo.
  • MINIMUM: el valor más bajo del campo.
  • MAXIMUM: el valor más alto del campo.
  • MEAN: el valor medio (suma dividida por el recuento total) de todos los valores del campo. Para calcular la fecha media de los campos de fecha, cada fecha se convierte en un número mediante el cálculo de la diferencia entre la fecha y una fecha de referencia (por ejemplo, 1900-01-01), calculada en milisegundos.
  • STANDARDDEVIATION: la desviación estándar de los valores del campo. Se calcula como la raíz cuadrada de la varianza, en la que la varianza es el promedio de la diferencia al cuadrado de cada valor con respecto al valor medio del campo.
  • MEDIAN: la mediana de todos los valores del campo. El valor mediano es el valor central de la lista ordenada de valores. Si hay un número par de valores, la mediana es el valor medio entre los dos valores centrales de la distribución.
  • COUNT: el número de valores no nulos del campo.
  • NUMBEROFUNIQUEVALUES: el número de valores únicos del campo.
  • MODE: el valor que más aparece en el campo.
  • LEASTCOMMON: el valor menos común del campo.
  • OUTLIERS: el número de registros con valores atípicos del campo. Los valores atípicos son aquellos que superan en más de 1,5 veces el rango intercuartil por encima del tercer cuartil o por debajo del primer cuartil de los valores del campo.
  • SUM: la suma de todos los valores del campo.
  • RANGE: la diferencia entre el valor más pequeño y el más grande del campo.
  • INTERQUARTILERANGE: el rango entre el primer cuartil y el tercer cuartil de los valores del campo. Representa el rango de la mitad centro de los datos.
  • FIRSTQUARTILE: el valor del primer cuartil del campo. Los cuartiles dividen la lista ordenada de valores en cuatro grupos que contienen igual número de valores. El primer cuartil es el límite superior del primer grupo en orden ascendente.
  • THIRDQUARTILE: el valor del tercer cuartil del campo. Los cuartiles dividen la lista ordenada de valores en cuatro grupos que contienen igual número de valores. El tercer cuartil es el límite superior del tercer grupo en orden ascendente.
  • COEFFICIENTOFVARIATION: el coeficiente de variación de los valores del campo. El coeficiente de variación es una medida de la propagación relativa de los valores. Se calcula como la desviación estándar dividida por el valor medio del campo.
  • SKEWNESS: el sesgo de los valores del campo. El sesgo mide la simetría de la distribución. El sesgo se calcula como el tercer momento (la media de los valores de los datos al cubo) dividido por la desviación estándar al cubo.
  • KURTOSIS: la curtosis de los valores del campo. La curtosis describe el peso de las colas de una distribución en comparación con la distribución normal, lo que ayuda a identificar la frecuencia de los valores extremos. La curtosis se calcula como el cuarto momento (el promedio de los valores de los datos elevados a la cuarta potencia) dividido por la cuarta potencia de la desviación estándar.

Value Table

Salida derivada

NombreExplicaciónTipo de datos
out_numeric

Las tablas de salida para los tipos de datos Numérico. La tabla se guardará en el espacio de trabajo especificado en el parámetro Ubicación de salida.

Table
out_text

Las tablas de salida para los tipos de datos Texto. La tabla se guardará en el espacio de trabajo especificado en el parámetro Ubicación de salida.

Table
out_date

Las tablas de salida para los tipos de datos Fecha. La tabla se guardará en el espacio de trabajo especificado en el parámetro Ubicación de salida.

Table
out_all

Las tablas de salida para todos los tipos de datos. La tabla se guardará en el espacio de trabajo especificado en el parámetro Ubicación de salida.

Table

Muestra de código

Ejemplo 1 de FieldStatisticsToTable (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función FieldStatisticsToTable.

import arcpy
arcpy.management.FieldStatisticsToTable("SNAP_County_Rates", 
      "LocId;Program_Name;Participants;SNAP_Rate;TimeofYear", r"C:\Output.gdb", 
      "ALL All_Table;DATE Date_Table;NUMERIC Num_Table;TEXT Text_Table")
Ejemplo 2 de FieldStatisticsToTable (script independiente)

El siguiente script independiente de Python muestra cómo utilizar la función FieldStatisticsToTable.

# Import system modules.
import arcpy

try:
    # Set the workspace and input features. 
    arcpy.env.workspace = r"C:\\Statistics\\MyData.gdb" 
    in_table = "County_Data" 
 
    # Set the input fields that will be used to calculate statistics. 
    in_fields = "population_total;unemployment_rate;income;county_name;sample_date" 
 
    # Set the output location.
    out_location = r"C:\\Statistics\\MyData.gdb"

    # Set the output table field type and name.
    out_tables = "ALL AllStats_Table;DATE DateStats_Table;NUMERIC NumStats_Table;TEXT TextStats_Table"
 
    # Run the Field Statistics To Table tool 
    arcpy.management.FieldStatisticsToTable (in_table, in_fields, out_location, out_tables) 
 
except arcpy.ExecuteError: 
    # If an error occurred when running the tool, print the error message. 
    print(arcpy.GetMessages())

Entornos

Esta herramienta no utiliza ningún entorno de geoprocesamiento.

Información de licenciamiento

  • Basic: Sí
  • Standard: Sí
  • Advanced: Sí

Temas relacionados