Etiqueta | Explicación | Tipo de datos |
Capa de entrada | Las entidades poligonales, de líneas, de puntos o tabulares que se van a describir. | Table View |
Tabla de salida | Una tabla nueva con la información de resumen. | Table |
Número de entidades de muestra (Opcional) | El número de entidades que se incluirán en la capa de muestra de salida. No se devuelve ninguna muestra si selecciona 0 entidades o si no proporciona ningún número. De forma predeterminada, no se devuelve ninguna capa de muestra. | Long |
Capa de muestra (Opcional) | Una clase de entidad nueva con una muestra de los datos de entrada. | Table; Feature Class |
Capa de extensión (Opcional) | Una clase de entidad nueva con la extensión espacial y temporal de los datos de entrada. | Feature Class |
Resumen
Resume las entidades en estadísticas de los campos calculados, entidades de muestra y límites de extensión.
Ilustración
Uso
A continuación, se ofrecen ejemplos de las tareas que se pueden realizar con la herramienta Describir dataset:
- Verificar que ha registrado correctamente el tiempo y la geometría con su recurso compartido de archivos de big data.
- Comprender los valores de los atributos mediante estadísticas de resumen de los campos.
- Visualizar sus big data con una capa de muestra. En lugar de dibujar un millón de entidades, dibujar una muestra.
- Ejecutar flujos de trabajo con una muestra de los datos antes de ampliar la escala a un procesamiento más largo y extenso.
- Determinar dónde se encuentra un dataset, calculando para ello la extensión geográfica.
De forma predeterminada, la herramienta genera una tabla que contiene las estadísticas de resumen de cada uno de los campos de la capa de entrada. Además, se imprime una tabla en la ventana de geoprocesamiento que describe cualquier geometría o propiedades de tiempo de la capa de entrada.
Si la capa de entrada tiene geometría, la herramienta imprime una tabla que describe las siguientes propiedades de geometría de la capa de entrada:
- Geometry type: el tipo de geometría de la capa de entrada. Este valor es punto, línea o polígono.
- Spatial reference: la referencia espacial de la capa de entrada.
- Count of non-empty features: el número de entidades que tienen una geometría válida dentro de la extensión de la referencia espacial de la capa de entrada.
- Count of empty features: el número de entidades que no tienen una geometría válida. Estas entidades pueden tener una geometría vacía o la geometría puede estar fuera de la extensión de la referencia espacial que se está utilizando.
- Spatial extent: la extensión espacial de las entidades en la capa de entrada.
Si la capa de entrada tiene el tiempo habilitado, la herramienta imprime una tabla que describe las siguientes propiedades de tiempo de la capa de entrada:
- Time type: el tipo de tiempo de la capa de entrada. Este valor es instante o intervalo.
- Count of non-empty features: el número de entidades que tienen un valor de tiempo válido.
- Count of empty features: el número de entidades que tienen un valor de tiempo nulo o no válido.
- Temporal extent: la extensión temporal de las entidades en la capa de entrada. Este valor contiene una hora de inicio y una hora de finalización.
Utilice el parámetro Número de entidades de muestra para especificar el número de entidades que se van a tomar como muestra. Si lo deja en blanco o selecciona 0, no se creará ninguna muestra. El subconjunto de salida tendrá los mismos ajustes de esquema, geometría y tiempo que las entidades de entrada. El subconjunto se puede utilizar para comprender cómo aparecen sus datasets al agregarlos a un mapa o visualizarlos en una tabla de atributos. Adicionalmente, puede ejecutar análisis en el subconjunto para determinar cuáles son las mejores entradas para un análisis a mayor escala.
Si especifica un tamaño de muestra mayor que el total de entidades de entrada, se devolverán todas las entidades.
La capa de muestra no representa una selección geográfica realmente aleatoria ni debe usarse para comprender la extensión ni la distribución geográficas de sus datos. Por ejemplo, si especifica 230 entidades en Número de entidades de muestra, el resultado puede contener 230 entidades de entrada en cualquier orden o de cualquier ubicación.
Cree una entidad de límite que describa la extensión de su dataset de entrada mediante el parámetro de salida Capa de extensión. La salida incluirá una sola entidad poligonal que representa la extensión geográfica de las entidades de entrada. La capa de extensión se puede utilizar para determinar dónde se almacenan sus datos, o bien utilícela como entrada de otra parte de su flujo de trabajo. Por ejemplo, utilícela como capa de polígonos con la que recortar las entidades con la herramienta Recortar capa de GeoAnalytics.
Solo tiene la opción de crear una capa de extensión para entidades poligonales, de punto o de línea. No se creará ninguna capa de extensión para las entidades tabulares.
Si lo desea, puede utilizar la configuración del entorno para especificar cómo se generarán las entidades.
Por ejemplo, use el entorno de Extensión para generar una capa de extensión que represente el área de interés, o entidades de muestra del área de estudio definida.
Además, use el entorno del Sistema de coordenadas de salida para proyectar salidas a la referencia espacial deseada.
Es posible mejorar el rendimiento de la herramienta Describir dataset con una de las siguientes acciones:
- Defina la extensión de los datos para analizar únicamente los datos de interés.
- Genere menos entidades de muestra.
- Utilice datos locales en los que se ejecute el análisis.
Esta herramienta de geoprocesamiento se basa en Spark. El análisis se completa en su equipo de escritorio utilizando varios núcleos en paralelo. Consulte Consideraciones acerca de las herramientas de GeoAnalytics Desktop para obtener más información acerca de la ejecución de análisis.
Al ejecutar herramientas de GeoAnalytics Desktop, el análisis se completa en su equipo de escritorio. Para un rendimiento óptimo, los datos deben estar disponibles en su escritorio. Si utiliza una capa de entidades alojada, se recomienda utilizar ArcGIS GeoAnalytics Server. Si sus datos no están almacenados localmente, se tardará más tiempo en ejecutar una herramienta. Para utilizar su ArcGIS GeoAnalytics Server para realizar un análisis, consulte GeoAnalytics Tools.
Parámetros
arcpy.gapro.DescribeDataset(input_layer, output, {sample_features}, {sample_layer}, {extent_layer})
Nombre | Explicación | Tipo de datos |
input_layer | Las entidades poligonales, de líneas, de puntos o tabulares que se van a describir. | Table View |
output | Una tabla nueva con la información de resumen. | Table |
sample_features (Opcional) | El número de entidades que se incluirán en la capa de muestra de salida. No se devuelve ninguna muestra si selecciona 0 entidades o si no proporciona ningún número. De forma predeterminada, no se devuelve ninguna capa de muestra. | Long |
sample_layer (Opcional) | Una clase de entidad nueva con una muestra de los datos de entrada. | Table; Feature Class |
extent_layer (Opcional) | Una clase de entidad nueva con la extensión espacial y temporal de los datos de entrada. | Feature Class |
Muestra de código
El siguiente script de la ventana de Python muestra cómo utilizar la herramienta DescribeDataset.
En este script, se describen las entidades de red y se crea una capa de muestra de 2.500 entidades.
#-------------------------------------------------------------------------------
# Name: DescribeDataset.py
# Description:
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/RedRiver_basin.gdb"
# Set local variables
inputDataset = "WaterSample"
output = "WSample_summary"
sample = "WSample_sample2500"
# Execute Describe Dataset
arcpy.gapro.DescribeDataset(inputDataset, output, 2500, sample)
Entornos
Información de licenciamiento
- Basic: No
- Standard: No
- Advanced: Sí