Crear cubo de espacio-tiempo (Geoanálisis)

Resumen

Resume un conjunto de puntos en una estructura de datos de netCDF agregándola en bins de espacio-tiempo. Dentro de cada bin, se cuentan los puntos y se agregan los atributos especificados. Para todas las ubicaciones de bin, se evalúan la tendencia de los recuentos y los valores de los campos de resumen.

Ilustración

Creación de cubo de espacio-tiempo

Uso

  • Esta herramienta agrega entidades de Capa de puntos en bins de espacio-tiempo. La estructura de datos que crea se puede interpretar como un cubo tridimensional compuesto de bins de espacio tiempo donde las dimensiones x e y representan el espacio y la dimensión t representa el tiempo.

    Bins de espacio-tiempo en un cubo tridimensional

  • Cada bin tiene una posición fija en el espacio (x,y) y en el tiempo (t). Los bins que abarcan la misma área (x, y) comparten el mismo Id. de ubicación. Los bins que abarcan la misma duración comparten el mismo Id. de período de tiempo. Dado que el cubo siempre es rectangular, aunque los datos de puntos no lo sean, algunas ubicaciones tendrán un recuento de puntos de cero para todos los períodos de tiempo. En muchos análisis solo se incluirán las ubicaciones con datos que tengan al menos un recuento de puntos superior a 1.

    Ubicaciones en el cubo de espacio-tiempo

  • Cada bin del cubo de espacio-tiempo tiene un LOCATION_ID, un time_step_ID y valores de campo COUNT y valores para cualquier Campo de resumen que se haya agregado a la hora de crear el cubo. Los bins que estén asociados a la misma ubicación física compartirán el mismo Id. de ubicación y, conjuntamente, representarán una serie temporal. Los bins que estén asociados al mismo periodo de tiempo compartirán el mismo Id. de periodo de tiempo y, conjuntamente, formarán un intervalo de tiempo. El valor del recuento de cada bin refleja la cantidad de puntos que se han generado en la ubicación asociada junto con el intervalo de tiempo asociado.

  • El parámetro Capa de puntos debe ser puntos que representen datos de eventos, tales como actos delictivos o incendios, incidentes de enfermedades, datos de ventas a clientes o accidentes de tráfico. Cada punto debe tener una fecha asociada al mismo. La herramienta requiere 60 puntos como mínimo y una variedad de marcas de tiempo. La herramienta fallará si los parámetros especificados dan lugar a un cubo con más de dos mil millones de bins.

  • Esta herramienta requiere datos proyectados para medir las distancias con precisión.

  • La salida de esta herramienta es una representación netCDF de los puntos de entrada. El cubo de espacio-tiempo resultante se descargará directamente en el equipo en el que se va a ejecutar el análisis. La ubicación se especificará en los mensajes de la herramienta.

  • No es raro que el dataset tenga una distribución temporal con un espaciado regular. Por ejemplo, puede tener datos anuales que coincidan siempre con el 1 de enero de cada año, o datos mensuales que tengan todos una marca de tiempo correspondiente al primer día de cada mes. Este tipo de datos recibe con frecuencia el nombre de datos de panel. Con los datos de panel, los cálculos de sesgo temporal mostrarán con frecuencia porcentajes altos. Este es el comportamiento esperado, pues cada bin cubrirá únicamente una unidad de tiempo concreta en el periodo de tiempo dado. Por ejemplo, si eligiera un Intervalo de tiempo de 1 año y sus datos coincidieran con el 1 de enero de cada año, cada bin abarcaría solo un día del año. Esto es perfectamente aceptable, pues se aplica a cada bin. El sesgo temporal se convierte en un problema cuando solo está presente para ciertos bins debido a los parámetros de creación de bins en lugar de a la distribución real de datos. Resulta importante evaluar el sesgo temporal a efectos de la cobertura esperada en cada bin, basándose en la distribución de los datos.

  • El sesgo temporal del informe de salida se calcula en forma de porcentaje del intervalo de tiempo que no contiene datos. Por ejemplo, un bin vacío tendría un 100 % de sesgo temporal. Un bin con un intervalo de tiempo de 1 mes y una Alineación de intervalos de tiempo final que solo contenga datos en las dos segundas semanas del primer intervalo de tiempo tendría un sesgo temporal del 50 por ciento en el primer intervalo de tiempo. Un bin con un intervalo de tiempo de 1 mes y una Alineación de intervalos de tiempo inicial que solo contenga datos en las dos primeras semanas del último intervalo de tiempo tendría un sesgo temporal del 50 por ciento en el último intervalo de tiempo.

  • Una vez que crea un cubo de espacio-tiempo, la extensión espacial del cubo no puede ampliarse nunca.

  • El parámetro Tiempo de referencia puede ser un valor de fecha y hora o simplemente un valor de fecha; nodebe ser solo un valor de hora.

  • Use un Intervalo de distancia adecuado para su análisis. Busque el equilibrio entre un intervalo de distancia tan grande que se pierdan los patrones subyacentes de sus datos de puntos y un intervalo de distancia tan pequeño que el cubo se rellene con recuentos de cero.
  • El análisis de tendencias realizado en los datos de recuento agregados y los valores de los campos de resumen se basan en la estadística de Mann-Kendall.

  • Las operaciones estadísticas siguientes están disponibles para agregar atributos con esta herramienta: suma, media, mínimo, máximo y desviación estándar.

  • Al rellenar bins vacíos con SPATIAL_NEIGHBORS, se utiliza la contigüidad de tipo Caso de la reina (basada en bordes y esquinas) de los vecinos de 2.º orden (incluye los vecinos y los vecinos de los vecinos). Con esta opción, se necesitan por lo menos 4 vecinos espaciales para rellenar el bin vacío.

  • Al rellenar bins vacíos con SPACE_TIME_NEIGHBORS, se utiliza la contigüidad de tipo Caso de la reina (basada en bordes y esquinas) de los vecinos de 2.º orden (incluye los vecinos y los vecinos de los vecinos). Además, se utilizan los vecinos temporales para cada uno de los bins que se determine que son vecinos espaciales yendo hacia atrás o hacia delante dos periodos de tiempo. Con esta opción, se necesitan por lo menos 13 vecinos en el espacio-tiempo para rellenar el bin vacío.

  • Al rellenar bins vacíos con TEMPORAL_TREND, los dos primeros periodos de tiempo y los dos últimos periodos de tiempo de una ubicación determinada deben tener valores en sus bins para poder interpolar valores en otros periodos de tiempo para esa ubicación.

  • Los valores nulos presentes en cualquiera de los registros de los campos de resumen darán lugar a que esas entidades se excluyan de los análisis. Si el recuento de puntos de cada bin forma parte de su estrategia de análisis, considere la opción de crear cubos separados, uno para el recuento (sin Campos de resumen) y otro para los Campos de resumen. Si el conjunto de valores nulos es distinto para cada campo de resumen, considere la opción de crear un cubo separado para cada campo de resumen.

  • Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en su GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.

  • Al ejecutar herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para su GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Por lo tanto, se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.

    Más información acerca del uso compartido de datos en el portal

    Más información sobre cómo crear un archivo compartido de Big Data mediante Server Manager

  • Se puede completar un análisis similar usando lo siguiente:

Parámetros

EtiquetaExplicaciónTipo de datos
Capa de puntos

La clase de entidad de punto de entrada que se va a agregar a bins de espacio-tiempo.

Feature Set
Nombre de salida

El cubo de datos de netCDF de salida que se creará para contener recuentos y resúmenes de los datos de puntos de entidades de entrada.

String
Intervalo de distancia

El tamaño de los bins se utilizará para agregar la Capa de puntos. Se agregarán todos los puntos que están dentro del mismo Intervalo de distancia e Intervalo de tiempo.

Distancia que determinará el tamaño de bin.

Linear Unit
Intervalo de tiempo

El número de segundos, minutos, horas, días, semanas o años que representará un periodo de tiempo único. Se agregarán todos los puntos que están dentro del mismo Intervalo de tiempo e Intervalo de distancia. Estos serían algunos ejemplos de entradas válidas para este parámetro: 1 semana, 13 días o 1 mes.

Time Unit
Alineación de intervalos de tiempo
(Opcional)

Especifica cómo se producirá la agregación en función del parámetro Intervalo de tiempo (time_step_interval en Python) .

  • Tiempo finalLos periodos de tiempo se alinearán con el último evento en el tiempo y se agregarán hacia atrás en el tiempo.
  • Tiempo inicialLos periodos de tiempo se alinearán con el primer evento en el tiempo y se agregarán hacia delante en el tiempo.
  • Tiempo de referenciaLos periodos de tiempo se alinearán con una fecha u hora especificada. Si todos los puntos de las entidades de entrada tienen una marcadetiempo mayor que el tiempo de referencia especificado (o si es exactamente el punto de tiempo inicial de las entidades de entrada), el intervalo del paso de tiempo empezará en ese instante de referencia y se agregará hacia delante en el tiempo (como sucede con la alineación Tiempo Inicial). Si todos los puntos de las entidades de entrada tienen una marca de tiempo menor que la referencia de tiempo especificada (o si es exactamente el punto de tiempo final de las entidades de entrada), el intervalo del paso de tiempo finalizará en ese instante de referencia y se agregará hacia atrás en el tiempo (como sucede con la alineación Tiempo de finalización). Si el tiempo de referencia especificado está en la mitad de la extensión de tiempo de los datos, se creará un intervalo de periodo de tiempo que terminará por el tiempo de referencia indicado (como sucede con la alineación Tiempo de finalización). Se crearán intervalos adicionales tanto antes como después del tiempo de referencia hasta que se haya cubierto toda la extensión de tiempo de los datos.
String
Tiempo de referencia
(Opcional)
Date
Campos de resumen
(Opcional)

Campo numérico que contiene los valores de atributos que se utilizarán para calcular la estadística especificada al consolidar en un cubo de espacio-tiempo. Se pueden especificar varias estadísticas y combinaciones de campos. Los valores nulos se excluyen de todos los cálculos estadísticos.

Están disponibles los siguientes tipos de estadísticas:

  • Suma: suma el valor total para el campo especificado dentro de cada bin.
  • Valor medio: calcula el valor medio para el campo especificado dentro de cada bin.
  • Mínimo: busca el valor más pequeño para todos los registros del campo especificado dentro de cada bin.
  • Máximo: busca el valor más alto para todos los registros del campo especificado dentro de cada bin.
  • Desviación estándar: busca la desviación estándar de los valores en el campo especificado dentro de cada bin.

Están disponibles los siguientes tipos de rellenos:

  • Ceros: rellena los bins vacíos con ceros.
  • Spatial_Neighbors: rellena los bins vacíos con el valor promedio de los vecinos espaciales.
  • Space Time Neighbors: rellena los bins vacíos con el valor medio de los vecinos espaciotemporales.
  • Temporal Trend: rellena los bins vacíos con un algoritmo de spline univariante interpolado.

Nota:
Los valores nulos presentes en cualquiera de los campos de resumen harán que esas entidades se excluyan del análisis. Si el recuento de puntos de cada bin forma parte de su estrategia de análisis, considere la opción de crear cubos separados, uno para el recuento (sin campos de resumen) y otro para los campos de resumen. Si el conjunto de valores nulos es distinto para cada campo de resumen, considere la opción de crear un cubo separado para cada campo de resumen.

Value Table

Salida derivada

EtiquetaExplicaciónTipo de datos
Archivo de salida

El cubo de espacio-tiempo agregado.

Archivo

arcpy.geoanalytics.CreateSpaceTimeCube(point_layer, output_name, distance_interval, time_step_interval, {time_step_interval_alignment}, {reference_time}, {summary_fields})
NombreExplicaciónTipo de datos
point_layer

La clase de entidad de punto de entrada que se va a agregar a bins de espacio-tiempo.

Feature Set
output_name

El cubo de datos de netCDF de salida que se creará para contener recuentos y resúmenes de los datos de puntos de entidades de entrada.

String
distance_interval

Distancia que determinará el tamaño de bin.

El tamaño de los bins se utilizará para agregar point_layer. Se agregarán todos los puntos que queden dentro del mismo distance_interval e time_step_interval.

Linear Unit
time_step_interval

El número de segundos, minutos, horas, días, semanas o años que representará un periodo de tiempo único. Se agregarán todos los puntos que queden dentro del mismo time_step_interval e distance_interval. Estos serían algunos ejemplos de entradas válidas para este parámetro: 1 semana, 13 días o 1 mes.

Time Unit
time_step_interval_alignment
(Opcional)

Especifica cómo se producirá la agregación en función del parámetro Intervalo de tiempo (time_step_interval en Python) .

  • END_TIMELos periodos de tiempo se alinearán con el último evento en el tiempo y se agregarán hacia atrás en el tiempo.
  • START_TIMELos periodos de tiempo se alinearán con el primer evento en el tiempo y se agregarán hacia delante en el tiempo.
  • REFERENCE_TIMELos periodos de tiempo se alinearán con una fecha u hora especificada. Si todos los puntos de las entidades de entrada tienen una marcadetiempo mayor que el tiempo de referencia especificado (o si es exactamente el punto de tiempo inicial de las entidades de entrada), el intervalo del paso de tiempo empezará en ese instante de referencia y se agregará hacia delante en el tiempo (como sucede con la alineación Tiempo Inicial). Si todos los puntos de las entidades de entrada tienen una marca de tiempo menor que la referencia de tiempo especificada (o si es exactamente el punto de tiempo final de las entidades de entrada), el intervalo del paso de tiempo finalizará en ese instante de referencia y se agregará hacia atrás en el tiempo (como sucede con la alineación Tiempo de finalización). Si el tiempo de referencia especificado está en la mitad de la extensión de tiempo de los datos, se creará un intervalo de periodo de tiempo que terminará por el tiempo de referencia indicado (como sucede con la alineación Tiempo de finalización). Se crearán intervalos adicionales tanto antes como después del tiempo de referencia hasta que se haya cubierto toda la extensión de tiempo de los datos.
String
reference_time
(Opcional)

Fecha u hora que se utilizará para alinear los intervalos de tiempo. Por ejemplo, para colocar en el bin los datos semanalmente, de lunes a domingo, establezca un tiempo de referencia el domingo a medianoche para garantizar que los bins cortan entre domingo y lunes a medianoche.

Date
summary_fields
[summary_fields,...]
(Opcional)

Campo numérico que contiene los valores de atributos que se utilizarán para calcular la estadística especificada al consolidar en un cubo de espacio-tiempo. Se pueden especificar varias estadísticas y combinaciones de campos. Los valores nulos se excluyen de todos los cálculos estadísticos.

Están disponibles los siguientes tipos de estadísticas:

  • Suma: suma el valor total para el campo especificado dentro de cada bin.
  • Valor medio: calcula el valor medio para el campo especificado dentro de cada bin.
  • Mínimo: busca el valor más pequeño para todos los registros del campo especificado dentro de cada bin.
  • Máximo: busca el valor más alto para todos los registros del campo especificado dentro de cada bin.
  • Desviación estándar: busca la desviación estándar de los valores en el campo especificado dentro de cada bin.

Están disponibles los siguientes tipos de rellenos:

  • Ceros: rellena los bins vacíos con ceros.
  • Spatial_Neighbors: rellena los bins vacíos con el valor promedio de los vecinos espaciales.
  • Space Time Neighbors: rellena los bins vacíos con el valor medio de los vecinos espaciotemporales.
  • Temporal Trend: rellena los bins vacíos con un algoritmo de spline univariante interpolado.

Nota:
Los valores nulos presentes en cualquiera de los campos de resumen harán que esas entidades se excluyan del análisis. Si el recuento de puntos de cada bin forma parte de su estrategia de análisis, considere la opción de crear cubos separados, uno para el recuento (sin campos de resumen) y otro para los campos de resumen. Si el conjunto de valores nulos es distinto para cada campo de resumen, considere la opción de crear un cubo separado para cada campo de resumen.

Value Table

Salida derivada

NombreExplicaciónTipo de datos
output

El cubo de espacio-tiempo agregado.

Archivo

Muestra de código

CreateSpaceTimeCube (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la herramienta CreateSpaceTimeCube.

#-------------------------------------------------------------------------------
# Name: CreateSpaceTimeCube.py
# Description: Create a cube representing the counts of Crimes
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inFeatures = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Crimes/BigDataCatalogServer/Chicago"
outCube = "CrimeCube.nc"
# Execute Create Space Time Cube
arcpy.geoanalytics.CreateSpaceTimeCube(inFeatures, outCube, "1 Kilometers", 
                                       "1 Weeks", "START_TIME")

Entornos

Casos especiales

Sistema de coordenadas de salida

El sistema de coordenadas que se usará para el análisis. El análisis se completará en el sistema de coordenadas de entrada salvo que este parámetro especifique otra opción. Para las GeoAnalytics Tools, los resultados finales se almacenarán en el data store espaciotemporal en WGS84.

Información de licenciamiento

  • Basic: Requiere ArcGIS GeoAnalytics Server
  • Standard: Requiere ArcGIS GeoAnalytics Server
  • Advanced: Requiere ArcGIS GeoAnalytics Server

Temas relacionados