Resumen
Dado un conjunto de entidades, identifica puntos calientes y puntos fríos estadísticamente significativos mediante la estadística Gi* de Getis-Ord.
Más información sobre cómo funciona el Análisis de punto caliente (Gi* de Getis-Ord)
Ilustración
Uso
Esta herramienta identifica clusters espaciales estadísticamente significativos de muchas entidades (puntos calientes) y pocas entidades (puntos fríos). Crea una clase de entidad de salida con una puntuación z, un valor p y un bin de nivel de confianza (Gi_Bin) para cada entidad de la entrada.
Durante el análisis, los puntos de entrada (incidentes) se consolidan en bins de un tamaño especificado y, a continuación, se analizan para determinar los puntos calientes. Los bins consolidados deben contener diversos valores (los recuentos de puntos de un bin deben ser muy variables).
Las puntuaciones z y los valores p son medidas de la significancia estadística que indican si se debe rechazar la hipótesis nula usando bins agregados. Es decir, indican si el clustering espacial de valores altos o bajos observado es más marcado de lo que se espera en una distribución aleatoria de esos valores. Los campos de puntuación z y valor p no reflejan ninguna corrección deÍndice de descubrimientos falsos (FDR).
Una puntuación z alta y un valor p pequeño para una entidad indican una presencia intensa de incidentes de puntos. Una puntuación z negativa baja y un valor p pequeño indican una ausencia de incidentes de puntos. Mientras más alta (o más baja) sea la puntuación z, más intenso será el clustering. Una puntuación z cercana a cero indica que no hay un clustering espacial evidente.
-
La puntuación z está basada en el cálculo de la hipótesis nula de aleatorización. Para obtener más información sobre las puntuaciones z, consulte ¿Qué es una puntuación z? ¿Qué es un valor p?
Buscar puntos calientes requiere que la capa de entrada se haya proyectado o que el sistema de coordenadas de salida sea un sistema de coordenadas proyectadas.
Cuando las entidades de entrada se analizan usando periodos de tiempo, cada periodo de tiempo se analiza con independencia de las entidades que quedan fuera de él.
El parámetro Referencia de periodo de tiempo puede ser un valor de fecha y hora o simplemente un valor de fecha; no puede ser solo un valor de hora.
Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en su GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.
Al ejecutar herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para su GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Por lo tanto, se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.
Más información acerca del uso compartido de datos en el portal
Más información sobre cómo crear un archivo compartido de Big Data mediante Server Manager
Se puede completar un análisis similar usando lo siguiente:
- La herramienta de geoprocesamiento Análisis de puntos calientes optimizado de ArcGIS Pro de la caja de herramientas Estadísticas espaciales.
- La herramienta de geoprocesamiento Buscar puntos calientes de ArcGIS Pro de la caja de herramientas Análisis de entidades estándar.
Sintaxis
arcpy.geoanalytics.FindHotSpots(point_layer, output_name, {bin_size}, {neighborhood_size}, {time_step_interval}, {time_step_alignment}, {time_step_reference}, {data_store})
Parámetro | Explicación | Tipo de datos |
point_layer | La clase de entidad de punto para la que se realizará el análisis de puntos calientes. | Feature Set |
output_name | El nombre de la capa de salida con los resultados de la puntuación z y el valor p. | String |
bin_size (Opcional) | El intervalo de distancia que representa el tamaño de bin y las unidades en las que se consolidará la point_layer. El intervalo de distancia debe tener una unidad lineal. | Linear Unit |
neighborhood_size (Opcional) | La extensión espacial de la vecindad de análisis. Este valor determina las entidades que se analizan conjuntamente para evaluar el clustering local. | Linear Unit |
time_step_interval (Opcional) | El intervalo que se utilizará para el periodo de tiempo. Este parámetro solo se utiliza si la función de tiempo está habilitada para point_layer. | Time Unit |
time_step_alignment (Opcional) | Especifica cómo se alinearán los periodos de tiempo . Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo.
| String |
time_step_reference (Opcional) | La hora que se utilizará para alinear los periodos de tiempo e intervalos de tiempo. Este parámetro solo se utiliza si la función de tiempo está habilitada para point_layer. | Date |
data_store (Opcional) | Especifica el ArcGIS Data Store en el que se guardará la salida. La predeterminada es SPATIOTEMPORAL_DATA_STORE. Todos los resultados almacenados en un big data store espaciotemporal se almacenarán en WGS84. Los resultados almacenados en un data store relacional mantendrán su sistema de coordenadas.
| String |
Salida derivada
Nombre | Explicación | Tipo de datos |
output | Los puntos calientes estadísticamente significativos. | Conjunto de entidades |
Muestra de código
El siguiente script de la ventana de Python muestra cómo utilizar la herramienta FindHotSpots.
#-------------------------------------------------------------------------------
# Name: FindHotSpots.py
# Description: Find Hots Spots of 311 calls for bins of 500 meters looking at neighbors withing 1 kilometers. Complete the analysis for each month.
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inFeatures = "https://sampleserver6.arcgisonline.com/arcgis/rest/services/SF311/FeatureServer/0"
bins = "500 Meters"
neighborhood = "1 Kilometers"
timeStep = "1 Months"
outFS = "HotSpotsOF311Data"
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute Find Hot Spots
arcpy.geoanalytics.FindHotSpots(inFeatures, outFS, bins, neighborhood, timeStep,
None, None, dataStore)
Entornos
- Sistema de coordenadas de salida
El sistema de coordenadas que se usará para el análisis. El análisis se completará en el sistema de coordenadas de entrada salvo que este parámetro especifique otra opción. Para las GeoAnalytics Tools, los resultados finales se almacenarán en el data store espaciotemporal en WGS84.
Información de licenciamiento
- Basic: Requiere ArcGIS GeoAnalytics Server
- Standard: Requiere ArcGIS GeoAnalytics Server
- Advanced: Requiere ArcGIS GeoAnalytics Server