Describir dataset (GeoAnalytics Desktop)

Resumen

Resume las entidades en estadísticas de los campos calculados, entidades de muestra y límites de extensión.

Ilustración

Diagrama del flujo de trabajo de Describir dataset

Uso

  • A continuación, se ofrecen ejemplos de las tareas que se pueden realizar con la herramienta Describir dataset:

    • Verificar que ha registrado correctamente el tiempo y la geometría con su recurso compartido de archivos de big data.
    • Comprender los valores de los atributos mediante estadísticas de resumen de los campos.
    • Visualizar sus big data con una capa de muestra. En lugar de dibujar un millón de entidades, dibujar una muestra.
    • Ejecutar flujos de trabajo con una muestra de los datos antes de ampliar la escala a un procesamiento más largo y extenso.
    • Determinar dónde se encuentra un dataset, calculando para ello la extensión geográfica.

  • La herramienta genera una tabla que contiene estadísticas de resumen de cada campo, así como un JSON que describe las propiedades de la capa de entrada de forma predeterminada.

  • Utilice el parámetro Número de entidades de muestra para especificar el número de entidades que se van a tomar como muestra. Si lo deja en blanco o selecciona 0, no se creará ninguna muestra. El subconjunto de salida tendrá los mismos ajustes de esquema, geometría y tiempo que las entidades de entrada. El subconjunto se puede utilizar para comprender cómo aparecen sus datasets al agregarlos a un mapa o visualizarlos en una tabla de atributos. Adicionalmente, puede ejecutar análisis en el subconjunto para determinar cuáles son las mejores entradas para un análisis a mayor escala.

  • Si especifica un tamaño de muestra mayor que el total de entidades de entrada, se devolverán todas las entidades.

  • La capa de muestra no representa una selección geográfica realmente aleatoria ni debe usarse para comprender la extensión ni la distribución geográficas de sus datos. Por ejemplo, si especifica 230 entidades en Número de entidades de muestra, el resultado puede contener 230 entidades de entrada en cualquier orden o de cualquier ubicación.

  • Cree una entidad de límite que describa la extensión de su dataset de entrada mediante el parámetro de salida Capa de extensión. La salida incluirá una sola entidad poligonal que representa la extensión geográfica de las entidades de entrada. La capa de extensión se puede utilizar para determinar dónde se almacenan sus datos, o bien utilícela como entrada de otra parte de su flujo de trabajo. Por ejemplo, utilícela como capa de polígonos con la que recortar las entidades con la herramienta Recortar capa de GeoAnalytics.

  • Solo tiene la opción de crear una capa de extensión para entidades poligonales, de punto o de línea. No se creará ninguna capa de extensión para las entidades tabulares.

  • Si lo desea, puede utilizar la configuración del entorno para especificar cómo se generarán las entidades.

    Por ejemplo, use el entorno de Extensión para generar una capa de extensión que represente el área de interés, o entidades de muestra del área de estudio definida.

    Además, use el entorno del Sistema de coordenadas de salida para proyectar salidas a la referencia espacial deseada.

  • Es posible mejorar el rendimiento de la herramienta Describir dataset con una de las siguientes acciones:

    • Defina la extensión de los datos para analizar únicamente los datos de interés.
    • Genere menos entidades de muestra.
    • Utilice datos locales en los que se ejecute el análisis.

  • Esta herramienta de geoprocesamiento se basa en Spark. El análisis se completa en su equipo de escritorio utilizando varios núcleos en paralelo. Consulte Consideraciones acerca de las herramientas de GeoAnalytics Desktop para obtener más información acerca de la ejecución de análisis.

  • Al ejecutar herramientas de GeoAnalytics Desktop, el análisis se completa en su equipo de escritorio. Para un rendimiento óptimo, los datos deben estar disponibles en su escritorio. Si utiliza una capa de entidades alojada, se recomienda utilizar ArcGIS GeoAnalytics Server. Si sus datos no están almacenados localmente, se tardará más tiempo en ejecutar una herramienta. Para utilizar ArcGIS GeoAnalytics Server con el fin de realizar un análisis, consulte GeoAnalytics Tools.

Sintaxis

DescribeDataset(input_layer, output, {sample_features}, {sample_layer}, {extent_layer})
ParámetroExplicaciónTipo de datos
input_layer

Las entidades poligonales, de líneas, de puntos o tabulares que se van a describir.

Table View
output

Una tabla nueva con la información de resumen.

Table
sample_features
(Opcional)

El número de entidades que se incluirán en la capa de muestra de salida. No se devuelve ninguna muestra si selecciona 0 entidades o si no proporciona ningún número. De forma predeterminada, no se devuelve ninguna capa de muestra.

Long
sample_layer
(Opcional)

Una clase de entidad nueva con una muestra de los datos de entrada.

Table; Feature Class
extent_layer
(Opcional)

Una clase de entidad nueva con la extensión espacial y temporal de los datos de entrada.

Feature Class

Muestra de código

Ejemplo de DescribeDataset (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la herramienta DescribeDataset.

En este script, se describen las entidades de red y se crea una capa de muestra de 2.500 entidades.

#-------------------------------------------------------------------------------
# Name: DescribeDataset.py
# Description: 
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/RedRiver_basin.gdb"
# Set local variables
inputDataset = "WaterSample"
output = "WSample_summary"
sample = "WSample_sample2500"
# Execute Describe Dataset
arcpy.gapro.DescribeDataset(inputDataset, output, 2500, sample)

Información de licenciamiento

  • Basic: No
  • Standard: No
  • Advanced: Sí

Temas relacionados