Resume un conjunto de puntos en una estructura de datos de netCDF agregándola en bins de espacio-tiempo. Dentro de cada bin, se cuentan los puntos y se agregan los atributos especificados. Para todas las ubicaciones de bin, se evalúan la tendencia de los recuentos y los valores de los campos de resumen.
Heredado:
La extensión de ArcGIS GeoAnalytics Server quedará obsoleta en ArcGIS Enterprise. La versión final de GeoAnalytics Server se incluyó con ArcGIS Enterprise 11.3. Esta herramienta de geoprocesamiento está disponible a través de ArcGIS Enterprise 11.3 y versiones anteriores.
Ilustración
Uso
Esta herramienta agrega el valor del parámetro Capa de puntos en bins de espacio-tiempo. Los bins de espacio-tiempo se pueden interpretar como un cubo tridimensional en el que las dimensiones x e y representan el espacio y la dimensión t representa el tiempo.
Cada bin tiene una posición fija en el espacio (x,y) y en el tiempo (t). Los bins que abarcan la misma área (x, y) comparten el mismo Id. de ubicación. Los bins que abarcan la misma duración comparten el mismo Id. de periodo de tiempo. Dado que el cubo siempre es rectangular, aunque los datos de puntos no lo sean, algunas ubicaciones tendrán un recuento de puntos de cero para todos los períodos de tiempo. En muchos análisis solo se incluirán las ubicaciones con datos que tengan al menos un recuento de puntos superior a 1.
Cada bin del cubo de espacio-tiempo tiene un valor para los campos LOCATION_ID, time_step_ID y COUNT, así como valores para los campos del parámetro Campos de resumen que se agregaron cuando se creó el cubo. Los bins que estén asociados a la misma ubicación física compartirán el mismo Id. de ubicación y, conjuntamente, representarán una serie temporal. Los bins que estén asociados al mismo periodo de tiempo compartirán el mismo Id. de periodo de tiempo y, conjuntamente, formarán un intervalo de tiempo. El valor del recuento de cada bin refleja la cantidad de puntos que se han generado en la ubicación asociada junto con el intervalo de tiempo asociado.
El valor del parámetro Capa de puntos debe ser puntos que representen datos de eventos, tales como actos delictivos o incendios, incidentes de enfermedades, datos de ventas a clientes o accidentes de tráfico. Cada punto debe tener una fecha asociada al mismo. Esta herramienta requiere 60 puntos como mínimo y una variedad de marcas de tiempo. La herramienta fallará si los parámetros especificados dan lugar a un cubo con más de 2 mil millones de bins.
Esta herramienta requiere datos proyectados para medir las distancias con precisión.
La salida de esta herramienta es una representación netCDF de los puntos de entrada. El cubo de espacio-tiempo resultante se descargará directamente en el equipo en el que se va a ejecutar el análisis. La ubicación se especificará en los mensajes de la herramienta.
No es raro que el dataset tenga una distribución temporal con un espaciado regular. Por ejemplo, puede tener datos anuales que caigan todos en el 1 de enero de cada año, o datos mensuales que tengan todos una marca de tiempo correspondiente al primer día de cada mes. Este tipo de datos recibe con frecuencia el nombre de datos de panel. Con los datos de panel, los cálculos de sesgo temporal mostrarán con frecuencia porcentajes altos. Este es el comportamiento esperado, pues cada bin cubrirá únicamente una unidad de tiempo concreta en el periodo de tiempo dado. Por ejemplo, si eligiera 1 año como valor del parámetro Intervalo de tiempo y sus datos coincidieran con el 1 de enero de cada año, cada bin abarcaría solo un día del año. Esto es perfectamente aceptable, pues se aplica a cada bin. El sesgo temporal se convierte en un problema cuando solo está presente para ciertos bins debido a los parámetros de creación de bins en lugar de a la distribución real de datos. Resulta importante evaluar el sesgo temporal a efectos de la cobertura esperada en cada bin, basándose en la distribución de los datos.
El sesgo temporal del informe de salida se calcula en forma de porcentaje del intervalo de tiempo que no contiene datos. Por ejemplo, un bin vacío tendría un 100 % de sesgo temporal. Un bin con un periodo de tiempo de 1 mes y un valor final del parámetro Alineación de periodos de tiempo que solo contenga datos para las dos segundas semanas del primer intervalo de tiempo tendría un sesgo temporal del 50 por ciento en el primer intervalo de tiempo. Un bin con un intervalo de tiempo de 1 mes y un valor inicial del parámetro Alineación de periodos de tiempo que solo contenga datos para las dos primeras semanas del último intervalo de tiempo tendría un sesgo temporal del 50 por ciento en el último intervalo de tiempo.
Una vez que crea un cubo de espacio-tiempo, la extensión espacial del cubo no puede ampliarse nunca.
El valor del parámetro Tiempo de referencia puede ser un valor de fecha y hora o un valor de fecha; no puede ser un valor de hora.
Utilice un valor para el parámetro Intervalo de distancia que tenga sentido para el análisis. Busque el equilibrio entre un intervalo de distancia tan grande que se pierdan los patrones subyacentes de los datos de puntos y un intervalo de distancia tan pequeño que el cubo se rellene con recuentos de cero.
El análisis de tendencias realizado en los datos de recuento agregados y los valores de los campos de resumen se basan en la estadística de Mann-Kendall.
Las operaciones estadísticas siguientes están disponibles para agregar atributos con esta herramienta: suma, media, mínimo, máximo y desviación estándar.
El parámetro Campos de resumen incluye las siguientes opciones para rellenar los bins vacíos:
Vecinos espaciales: se utiliza la contigüidad de tipo Caso de la reina (basada en bordes y esquinas) de los vecinos de 2o orden (incluye los vecinos y los vecinos de los vecinos). Se necesitan por lo menos cuatro vecinos espaciales para rellenar el bin vacío.
Vecinos espaciotemporales: se utiliza la contigüidad de tipo Caso de la reina (basada en bordes y esquinas) de los vecinos de 2o orden (incluye los vecinos y los vecinos de los vecinos). Además, se utilizan los vecinos temporales para cada uno de los bins que se determine que son vecinos espaciales yendo hacia atrás o hacia delante dos periodos de tiempo. Se necesitan por lo menos 13 vecinos espaciotemporales para rellenar el bin vacío.
Tendencia temporal: los dos primeros periodos de tiempo y los dos últimos periodos de tiempo de una ubicación determinada deben tener valores en sus bins para poder interpolar valores en otros periodos de tiempo para esa ubicación.
Ceros: los bins vacíos se rellenan con ceros.
Los valores nulos en cualquiera de los registros de los campos de resumen provocarán que esas entidades se excluyan de los análisis. Si el recuento de puntos de cada bin forma parte de su estrategia de análisis, considere la opción de crear cubos separados, uno para el recuento (sin ningún valor en el parámetro Campos de resumen) y otro para el valor del parámetro Campos de resumen. Si el conjunto de valores nulos es distinto para cada campo de resumen, plantéese crear un cubo separado para cada campo de resumen.
Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.
Al ejecutar herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.
La clase de entidad de punto de entrada que se va a agregar a bins de espacio-tiempo.
Feature Set
Nombre de salida
El cubo de datos de netCDF de salida que se creará para contener recuentos y resúmenes de los datos de puntos de entidades de entrada.
String
Intervalo de distancia
El tamaño de los bins se utilizará para agregar el valor del parámetro Capa de puntos. Se agregarán todos los puntos que se encuentren dentro de los mismos valores de los parámetros Intervalo de distancia e Intervalo de tiempo.
Distancia que determinará el tamaño de bin.
Linear Unit
Intervalo de tiempo
El número de segundos, minutos, horas, días, semanas o años que representará un periodo de tiempo único. Se agregarán todos los puntos dentro de los mismos valores de los parámetros Intervalo de tiempo e Intervalo de distancia. Estos serían algunos ejemplos de entradas válidas para este parámetro: 1 semana, 13 días o 1 mes.
Time Unit
Alineación de intervalos de tiempo
(Opcional)
Especifica cómo se producirá la agregación en función del valor del parámetro Intervalo de tiempo.
Hora de finalización—Los periodos de tiempo se alinearán con el último evento en el tiempo y se agregarán hacia atrás en el tiempo.
Hora de inicio—Los periodos de tiempo se alinearán con el primer evento en el tiempo y se agregarán hacia delante en el tiempo.
Tiempo de referencia—Los periodos de tiempo se alinearán con una fecha u hora especificada. Si todos los puntos de las entidades de entrada tienen una marcadetiempo mayor que el tiempo de referencia especificado (o si es exactamente el punto de tiempo inicial de las entidades de entrada), el intervalo del paso de tiempo empezará en ese instante de referencia y se agregará hacia delante en el tiempo (como sucede con la alineación de tiempo inicial). Si todos los puntos de las entidades de entrada tienen una marca de tiempo menor que la referencia de tiempo especificada (o si es exactamente el punto de tiempo final de las entidades de entrada), el intervalo del paso de tiempo finalizará en ese instante de referencia y se agregará hacia atrás en el tiempo (como sucede con la alineación de tiempo de finalización). Si el tiempo de referencia especificado está en la mitad de la extensión de tiempo de los datos, se creará un intervalo de periodo de tiempo que terminará por el tiempo de referencia indicado (como sucede con la alineación del tiempo de finalización). Se crearán intervalos adicionales tanto antes como después del tiempo de referencia hasta que se haya cubierto toda la extensión de tiempo de los datos.
String
Tiempo de referencia
(Opcional)
La fecha o la hora que se utilizará para alinear los intervalos de períodos de tiempo. Por ejemplo, para colocar en el bin los datos semanalmente, de lunes a domingo, establezca un tiempo de referencia el domingo a medianoche para garantizar que los bins cortan entre domingo y lunes a medianoche.
Date
Campos de resumen
(Opcional)
Campo numérico que contiene los valores de atributos que se utilizarán para calcular la estadística especificada al consolidar en un cubo de espacio-tiempo. Se pueden especificar varias estadísticas y combinaciones de campos. Los valores nulos se excluyen de todos los cálculos estadísticos.
La clase de entidad de punto de entrada que se va a agregar a bins de espacio-tiempo.
Feature Set
output_name
El cubo de datos de netCDF de salida que se creará para contener recuentos y resúmenes de los datos de puntos de entidades de entrada.
String
distance_interval
Distancia que determinará el tamaño de bin.
Tamaño de los bins que se utilizará para agregar el valor del parámetro point_layer. Se agregarán todos los puntos que se encuentren dentro de los mismos valores de los parámetros distance_interval y time_step_interval.
Linear Unit
time_step_interval
El número de segundos, minutos, horas, días, semanas o años que representará un periodo de tiempo único. Se agregarán todos los puntos dentro de los mismos valores de los parámetros time_step_interval y distance_interval. Estos serían algunos ejemplos de entradas válidas para este parámetro: 1 semana, 13 días o 1 mes.
Time Unit
time_step_interval_alignment
(Opcional)
Especifica cómo se producirá la agregación en función del valor del parámetro time_step_interval.
END_TIME—Los periodos de tiempo se alinearán con el último evento en el tiempo y se agregarán hacia atrás en el tiempo.
START_TIME—Los periodos de tiempo se alinearán con el primer evento en el tiempo y se agregarán hacia delante en el tiempo.
REFERENCE_TIME—Los periodos de tiempo se alinearán con una fecha u hora especificada. Si todos los puntos de las entidades de entrada tienen una marcadetiempo mayor que el tiempo de referencia especificado (o si es exactamente el punto de tiempo inicial de las entidades de entrada), el intervalo del paso de tiempo empezará en ese instante de referencia y se agregará hacia delante en el tiempo (como sucede con la alineación de tiempo inicial). Si todos los puntos de las entidades de entrada tienen una marca de tiempo menor que la referencia de tiempo especificada (o si es exactamente el punto de tiempo final de las entidades de entrada), el intervalo del paso de tiempo finalizará en ese instante de referencia y se agregará hacia atrás en el tiempo (como sucede con la alineación de tiempo de finalización). Si el tiempo de referencia especificado está en la mitad de la extensión de tiempo de los datos, se creará un intervalo de periodo de tiempo que terminará por el tiempo de referencia indicado (como sucede con la alineación del tiempo de finalización). Se crearán intervalos adicionales tanto antes como después del tiempo de referencia hasta que se haya cubierto toda la extensión de tiempo de los datos.
String
reference_time
(Opcional)
La fecha o la hora que se utilizará para alinear los intervalos de períodos de tiempo. Por ejemplo, para colocar en el bin los datos semanalmente, de lunes a domingo, establezca un tiempo de referencia el domingo a medianoche para garantizar que los bins cortan entre domingo y lunes a medianoche.
Date
summary_fields
[summary_fields,...]
(Opcional)
Campo numérico que contiene los valores de atributos que se utilizarán para calcular la estadística especificada al consolidar en un cubo de espacio-tiempo. Se pueden especificar varias estadísticas y combinaciones de campos. Los valores nulos se excluyen de todos los cálculos estadísticos.
Value Table
Salida derivada
Nombre
Explicación
Tipo de datos
output
El cubo de espacio-tiempo agregado.
File
Muestra de código
CreateSpaceTimeCube (script independiente)
En el siguiente script de Python se muestra cómo utilizar la función CreateSpaceTimeCube.
# Name: CreateSpaceTimeCube.py
# Description: Create a cube representing the counts of Crimes
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inFeatures = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Crimes/BigDataCatalogServer/Chicago"
outCube = "CrimeCube.nc"
# Run Create Space Time Cube
arcpy.geoanalytics.CreateSpaceTimeCube(inFeatures, outCube, "1 Kilometers",
"1 Weeks", "START_TIME")
El sistema de coordenadas que se usará para el análisis. El análisis se completará en el sistema de coordenadas de entrada salvo que este parámetro especifique otra opción. En GeoAnalytics Tools, los resultados finales se almacenarán en el data store espaciotemporal en WGS84.