Resumen
Resume un conjunto de puntos en una estructura de datos de netCDF agregándola en bins de espacio-tiempo. Dentro de cada bin, se cuentan los puntos y se agregan los atributos especificados. Para todas las ubicaciones de bin, se evalúan la tendencia de los recuentos y los valores de los campos de resumen.
Ilustración
Uso
Esta herramienta agrega entidades de Capa de puntos en bins de espacio-tiempo. La estructura de datos que crea se puede interpretar como un cubo tridimensional compuesto de bins de espacio tiempo donde las dimensiones x e y representan el espacio y la dimensión t representa el tiempo.
Cada bin tiene una posición fija en el espacio (x,y) y en el tiempo (t). Los bins que abarcan la misma área (x, y) comparten el mismo Id. de ubicación. Los bins que abarcan la misma duración comparten el mismo Id. de período de tiempo. Dado que el cubo siempre es rectangular, aunque los datos de puntos no lo sean, algunas ubicaciones tendrán un recuento de puntos de cero para todos los períodos de tiempo. En muchos análisis solo se incluirán las ubicaciones con datos que tengan al menos un recuento de puntos superior a 1.
Cada bin del cubo de espacio-tiempo tiene un LOCATION_ID, un time_step_ID y valores de campo COUNT y valores para cualquier Campo de resumen que se haya agregado a la hora de crear el cubo. Los bins que estén asociados a la misma ubicación física compartirán el mismo Id. de ubicación y, conjuntamente, representarán una serie temporal. Los bins que estén asociados al mismo periodo de tiempo compartirán el mismo Id. de periodo de tiempo y, conjuntamente, formarán un intervalo de tiempo. El valor del recuento de cada bin refleja la cantidad de puntos que se han generado en la ubicación asociada junto con el intervalo de tiempo asociado.
El parámetro Capa de puntos debe ser puntos que representen datos de eventos, tales como actos delictivos o incendios, incidentes de enfermedades, datos de ventas a clientes o accidentes de tráfico. Cada punto debe tener una fecha asociada al mismo. La herramienta requiere 60 puntos como mínimo y una variedad de marcas de tiempo. La herramienta fallará si los parámetros especificados dan lugar a un cubo con más de dos mil millones de bins.
Esta herramienta requiere datos proyectados para medir las distancias con precisión.
La salida de esta herramienta es una representación netCDF de los puntos de entrada. El cubo de espacio-tiempo resultante se descargará directamente en el equipo en el que se va a ejecutar el análisis. La ubicación se especificará en los mensajes de la herramienta.
No es raro que el dataset tenga una distribución temporal con un espaciado regular. Por ejemplo, puede tener datos anuales que coincidan siempre con el 1 de enero de cada año, o datos mensuales que tengan todos una marca de tiempo correspondiente al primer día de cada mes. Este tipo de datos recibe con frecuencia el nombre de datos de panel. Con los datos de panel, los cálculos de sesgo temporal mostrarán con frecuencia porcentajes altos. Este es el comportamiento esperado, pues cada bin cubrirá únicamente una unidad de tiempo concreta en el periodo de tiempo dado. Por ejemplo, si eligiera un Intervalo de tiempo de 1 año y sus datos coincidieran con el 1 de enero de cada año, cada bin abarcaría solo un día del año. Esto es perfectamente aceptable, pues se aplica a cada bin. El sesgo temporal se convierte en un problema cuando solo está presente para ciertos bins debido a los parámetros de creación de bins en lugar de a la distribución real de datos. Resulta importante evaluar el sesgo temporal a efectos de la cobertura esperada en cada bin, basándose en la distribución de los datos.
El sesgo temporal del informe de salida se calcula en forma de porcentaje del intervalo de tiempo que no contiene datos. Por ejemplo, un bin vacío tendría un 100 % de sesgo temporal. Un bin con un intervalo de tiempo de 1 mes y una Alineación de intervalos de tiempo final que solo contenga datos en las dos segundas semanas del primer intervalo de tiempo tendría un sesgo temporal del 50 por ciento en el primer intervalo de tiempo. Un bin con un intervalo de tiempo de 1 mes y una Alineación de intervalos de tiempo inicial que solo contenga datos en las dos primeras semanas del último intervalo de tiempo tendría un sesgo temporal del 50 por ciento en el último intervalo de tiempo.
Una vez que crea un cubo de espacio-tiempo, la extensión espacial del cubo no puede ampliarse nunca.
El parámetro Tiempo de referencia puede ser un valor de fecha y hora o simplemente un valor de fecha; nodebe ser solo un valor de hora.
- Use un Intervalo de distancia adecuado para su análisis. Busque el equilibrio entre un intervalo de distancia tan grande que se pierdan los patrones subyacentes de sus datos de puntos y un intervalo de distancia tan pequeño que el cubo se rellene con recuentos de cero.
El análisis de tendencias realizado en los datos de recuento agregados y los valores de los campos de resumen se basan en la estadística de Mann-Kendall.
Las operaciones estadísticas siguientes están disponibles para agregar atributos con esta herramienta: suma, media, mínimo, máximo y desviación estándar.
Al rellenar bins vacíos con SPATIAL_NEIGHBORS, se utiliza la contigüidad de tipo Caso de la reina (basada en bordes y esquinas) de los vecinos de 2.º orden (incluye los vecinos y los vecinos de los vecinos). Con esta opción, se necesitan por lo menos 4 vecinos espaciales para rellenar el bin vacío.
Al rellenar bins vacíos con SPACE_TIME_NEIGHBORS, se utiliza la contigüidad de tipo Caso de la reina (basada en bordes y esquinas) de los vecinos de 2.º orden (incluye los vecinos y los vecinos de los vecinos). Además, se utilizan los vecinos temporales para cada uno de los bins que se determine que son vecinos espaciales yendo hacia atrás o hacia delante dos periodos de tiempo. Con esta opción, se necesitan por lo menos 13 vecinos en el espacio-tiempo para rellenar el bin vacío.
Al rellenar bins vacíos con TEMPORAL_TREND, los dos primeros periodos de tiempo y los dos últimos periodos de tiempo de una ubicación determinada deben tener valores en sus bins para poder interpolar valores en otros periodos de tiempo para esa ubicación.
Los valores nulos presentes en cualquiera de los registros de los campos de resumen darán lugar a que esas entidades se excluyan de los análisis. Si el recuento de puntos de cada bin forma parte de su estrategia de análisis, considere la opción de crear cubos separados, uno para el recuento (sin Campos de resumen) y otro para los Campos de resumen. Si el conjunto de valores nulos es distinto para cada campo de resumen, considere la opción de crear un cubo separado para cada campo de resumen.
Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en su GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.
Al ejecutar Herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para su GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Por lo tanto, se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.
Más información acerca del uso compartido de datos en el portal
Más información sobre cómo crear un archivo compartido de Big Data mediante Server Manager
Se puede completar un análisis similar usando lo siguiente:
- La herramienta Crear cubo de espacio-tiempo agregando puntos de la caja de herramientas Minería de patrones en espacio-tiempo.
Sintaxis
CreateSpaceTimeCube(point_layer, output_name, distance_interval, time_step_interval, {time_step_interval_alignment}, {reference_time}, {summary_fields})
Parámetro | Explicación | Tipo de datos |
point_layer | La clase de entidad de punto de entrada que se va a agregar a bins de espacio-tiempo. | Feature Set |
output_name | El cubo de datos de netCDF de salida que se creará para contener recuentos y resúmenes de los datos de puntos de entidades de entrada. | String |
distance_interval | Distancia que determinará el tamaño de bin. El tamaño de los bins se utilizará para agregar point_layer. Se agregarán todos los puntos que queden dentro del mismo distance_interval e time_step_interval. | Linear Unit |
time_step_interval | El número de segundos, minutos, horas, días, semanas o años que representará un periodo de tiempo único. Se agregarán todos los puntos que queden dentro del mismo time_step_interval e distance_interval. Estos serían algunos ejemplos de entradas válidas para este parámetro: 1 semana, 13 días o 1 mes. | Time Unit |
time_step_interval_alignment (Opcional) | Especifica cómo se producirá la agregación en función del parámetro Intervalo de tiempo (time_step_interval en Python) .
| String |
reference_time (Opcional) | Fecha u hora que se utilizará para alinear los intervalos de tiempo. Por ejemplo, para colocar en el bin los datos semanalmente, de lunes a domingo, establezca un tiempo de referencia el domingo a medianoche para garantizar que los bins cortan entre domingo y lunes a medianoche. | Date |
summary_fields [summary_fields,...] (Opcional) | Campo numérico que contiene los valores de atributos que se utilizarán para calcular la estadística especificada al consolidar en un cubo de espacio-tiempo. Se pueden especificar varias estadísticas y combinaciones de campos. Los valores nulos se excluyen de todos los cálculos estadísticos. Están disponibles los siguientes tipos de estadísticas:
Están disponibles los siguientes tipos de rellenos:
Nota:Los valores nulos presentes en cualquiera de los campos de resumen harán que esas entidades se excluyan del análisis. Si el recuento de puntos de cada bin forma parte de su estrategia de análisis, considere la opción de crear cubos separados, uno para el recuento (sin campos de resumen) y otro para los campos de resumen. Si el conjunto de valores nulos es distinto para cada campo de resumen, considere la opción de crear un cubo separado para cada campo de resumen. | Value Table |
Salida derivada
Nombre | Explicación | Tipo de datos |
output | El cubo de espacio-tiempo agregado. | Archivo |
Muestra de código
El siguiente script de la ventana de Python muestra cómo utilizar la herramienta CreateSpaceTimeCube.
#-------------------------------------------------------------------------------
# Name: CreateSpaceTimeCube.py
# Description: Create a cube representing the counts of Crimes
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inFeatures = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Crimes/BigDataCatalogServer/Chicago"
outCube = "CrimeCube.nc"
# Execute Create Space Time Cube
arcpy.geoanalytics.CreateSpaceTimeCube(inFeatures, outCube, "1 Kilometers",
"1 Weeks", "START_TIME")
Entornos
- Sistema de coordenadas de salida
El sistema de coordenadas que se usará para el análisis. El análisis se completará en el sistema de coordenadas de entrada salvo que este parámetro especifique otra opción. Para las GeoAnalytics Tools, los resultados finales se almacenarán en el data store espaciotemporal en WGS84.
Información de licenciamiento
- Basic: Requiere ArcGIS GeoAnalytics Server
- Standard: Requiere ArcGIS GeoAnalytics Server
- Advanced: Requiere ArcGIS GeoAnalytics Server