Resumen
Resume las entidades en estadísticas de los campos calculados, entidades de muestra y límites de extensión.
Ilustración
Uso
Esta herramienta de geoprocesamiento está disponible con ArcGIS Enterprise 10.7 o posterior.
A continuación, se ofrecen ejemplos de las tareas que se pueden realizar con la herramienta Describir dataset:
- Verificar que ha registrado correctamente el tiempo y la geometría con su recurso compartido de archivos de big data.
- Comprender los valores de los atributos mediante estadísticas de resumen de los campos.
- Visualizar sus big data con una capa de muestra. En lugar de dibujar un millón de entidades, dibujar una muestra.
- Ejecutar flujos de trabajo con una muestra de los datos antes de ampliar la escala a un procesamiento más largo y extenso.
- Determinar dónde se encuentra un dataset, calculando para ello la extensión geográfica.
La herramienta genera una tabla que contiene estadísticas de resumen de cada campo, así como un JSON que describe las propiedades de la capa de entrada de forma predeterminada.
Utilice el parámetro Número de entidades de muestra para especificar el número de entidades que se van a tomar como muestra. Si lo deja en blanco o selecciona 0, no se creará ninguna muestra. El subconjunto de salida tendrá los mismos ajustes de esquema, geometría y tiempo que las entidades de entrada. El subconjunto se puede utilizar para comprender cómo aparecen sus datasets al agregarlos a un mapa o visualizarlos en una tabla de atributos. Adicionalmente, puede ejecutar análisis en el subconjunto para determinar cuáles son las mejores entradas para un análisis a mayor escala.
Si especifica un tamaño de muestra mayor que el total de entidades de entrada, se devolverán todas las entidades.
La capa de muestra no representa una selección geográfica realmente aleatoria ni debe usarse para comprender la extensión ni la distribución geográficas de sus datos. Por ejemplo, si especifica 230 entidades en Número de entidades de muestra, el resultado puede contener 230 entidades de entrada en cualquier orden o de cualquier ubicación.
Cree una entidad de límite que describa la extensión de su dataset de entrada mediante el parámetro Crear capa de extensión. La salida incluirá una sola entidad poligonal que representa la extensión geográfica de las entidades de entrada. La capa de extensión se puede utilizar para determinar dónde se almacenan sus datos, o bien utilícela como entrada de otra parte de su flujo de trabajo. Por ejemplo, utilícela como capa de polígonos con la que recortar las entidades con la herramienta Recortar capa de GeoAnalytics.
Si lo desea, puede utilizar la configuración del entorno para especificar cómo se generarán las entidades.
Por ejemplo, use el entorno de Extensión para generar una capa de extensión que represente el área de interés, o entidades de muestra del área de estudio definida.
Además, use el entorno del Sistema de coordenadas de salida para proyectar salidas a la referencia espacial deseada.
El parámetro Crear capa de extensión solo es compatible con entidades poligonales, de líneas y de puntos. No se creará ninguna capa de extensión para las entidades tabulares.
Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en su GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.
Al ejecutar Herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para su GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Por lo tanto, se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.
Más información acerca del uso compartido de datos en el portal
Más información sobre cómo crear un archivo compartido de Big Data mediante Server Manager
Sintaxis
DescribeDataset(input_layer, output_name, {sample_features}, {create_extent_layer}, {data_store})
Parámetro | Explicación | Tipo de datos |
input_layer | Las entidades poligonales, de líneas, de puntos o tabulares que se van a describir. | Record Set |
output_name | El nombre del servicio de entidades de salida. | String |
sample_features (Opcional) | El número de entidades que se incluirán en la capa de muestra de salida. No se devuelve ninguna muestra si selecciona 0 entidades o si no proporciona ningún número. De forma predeterminada, no se devuelve ninguna capa de muestra. | Long |
create_extent_layer (Opcional) | Especifica si se creará una capa de extensión de salida. La extensión es un polígono que representa la extensión espacial y temporal de las entidades de entrada.
| Boolean |
data_store (Opcional) | Especifica el ArcGIS Data Store en el que se guardará la salida. La predeterminada es SPATIOTEMPORAL_DATA_STORE. Todos los resultados almacenados en el SPATIOTEMPORAL_DATA_STORE se almacenarán en WGS84. Los resultados almacenados en un RELATIONAL_DATA_STORE mantendrán su sistema de coordenadas.
| String |
Salida derivada
Nombre | Explicación | Tipo de datos |
output | La capa de salida que contiene los cálculos estadísticos resumidos. | Conjunto de registros |
extent_layer | Si el parámetro create_extent_layer está seleccionado, la herramienta generará una capa que contiene un solo polígono que representa la extensión de su dataset. | Conjunto de entidades |
sample_layer | Si el parámetro sample_features especifica un valor mayor que cero, la herramienta generará una capa que contiene el número especificado de entidades de muestra del dataset. | Conjunto de entidades |
output_json | Este parámetro no se utiliza. En los mensajes de la herramienta se incluye una cadena de caracteres JSON que contiene toda la información de resumen calculada en el análisis. | Cadena |
Muestra de código
El siguiente script de la ventana de Python muestra cómo utilizar la herramienta DescribeDataset.
En este script, se describen las entidades de red y se crea una capa de muestra de 2.500 entidades.
#-------------------------------------------------------------------------------
# Name: DescribeDataset.py
# Description:
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inputDataset = "https://sampleserver.domain.com/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_MyBDFS/BigDataCatalogServer/networkDataset"
outputName = "my_network_described"
dataStore = "RELATIONAL"
# Execute Describe Dataset
arcpy.geoanalytics.DescribeDataset(inputDataset, outputName, 2500, "CREATE_EXTENT", dataStore)
Entornos
- Sistema de coordenadas de salida
El sistema de coordenadas que se usará para el análisis. El análisis se completará en el sistema de coordenadas de entrada salvo que este parámetro especifique otra opción. Para las GeoAnalytics Tools, los resultados finales se almacenarán en el data store espaciotemporal en WGS84.
Información de licenciamiento
- Basic: Requiere ArcGIS GeoAnalytics Server
- Standard: Requiere ArcGIS GeoAnalytics Server
- Advanced: Requiere ArcGIS GeoAnalytics Server