Resumen
Dado un conjunto de entidades, identifica puntos calientes y puntos fríos estadísticamente significativos mediante la estadística Gi* de Getis-Ord.
Más información sobre cómo funciona el Análisis de punto caliente (Gi* de Getis-Ord)
Ilustración
Uso
Esta herramienta identifica clusters espaciales estadísticamente significativos de muchas entidades (puntos calientes) y pocas entidades (puntos fríos). Crea una clase de entidad de salida con una puntuación z, un valor p y un bin de nivel de confianza (Gi_Bin) para cada entidad de la entrada.
Durante el análisis, los puntos de entrada (incidentes) se consolidan en bins de un tamaño especificado y, a continuación, se analizan para determinar los puntos calientes. Los bins consolidados deben contener diversos valores (los recuentos de puntos de un bin deben ser muy variables).
Las puntuaciones z y los valores p son medidas de la significancia estadística que indican si se debe rechazar la hipótesis nula usando bins agregados. Es decir, indican si el clustering espacial de valores altos o bajos observado es más marcado de lo que se espera en una distribución aleatoria de esos valores. Los campos de puntuación z y valor p no reflejan ninguna corrección deÍndice de descubrimientos falsos (FDR).
Una puntuación z alta y un valor p pequeño para una entidad indican una presencia intensa de incidentes de puntos. Una puntuación z negativa baja y un valor p pequeño indican una ausencia de incidentes de puntos. Mientras más alta (o más baja) sea la puntuación z, más intenso será el clustering. Una puntuación z cercana a cero indica que no hay un clustering espacial evidente.
-
La puntuación z está basada en el cálculo de la hipótesis nula de aleatorización. Para obtener más información sobre las puntuaciones z, consulte ¿Qué es una puntuación z? ¿Qué es un valor p?
El análisis con agrupamiento en bins requiere que su entrada esté proyectada o que el sistema de coordenadas de salida esté establecido como un sistema de coordenadas proyectadas. Si sus datos no se encuentran en un sistema de coordenadas proyectadas y no desea establecer ninguno, se usará una proyección en función de la extensión de los datos que está analizando.
Cuando las entidades de entrada se analizan usando periodos de tiempo, cada periodo de tiempo se analiza con independencia de las entidades que quedan fuera de él.
El parámetro Referencia de periodo de tiempo puede ser un valor de fecha y hora o simplemente un valor de fecha; no puede ser solo un valor de hora.
Esta herramienta de geoprocesamiento se basa en Spark. El análisis se completa en su equipo de escritorio utilizando varios núcleos en paralelo. Consulte Consideraciones acerca de las herramientas de GeoAnalytics Desktop para obtener más información acerca de la ejecución de análisis.
Al ejecutar herramientas de GeoAnalytics Desktop, el análisis se completa en su equipo de escritorio. Para un rendimiento óptimo, los datos deben estar disponibles en su escritorio. Si utiliza una capa de entidades alojada, se recomienda utilizar ArcGIS GeoAnalytics Server. Si sus datos no están almacenados localmente, se tardará más tiempo en ejecutar una herramienta. Para utilizar ArcGIS GeoAnalytics Server con el fin de realizar un análisis, consulte GeoAnalytics Tools.
Se puede completar un análisis similar usando lo siguiente:
- La herramienta de geoprocesamiento Análisis de puntos calientes optimizado de ArcGIS Pro de la caja de herramientas Estadísticas espaciales.
- La herramienta de geoprocesamiento Buscar puntos calientes de ArcGIS Pro de la caja de herramientas Análisis de entidades estándar.
Sintaxis
arcpy.gapro.FindHotSpots(point_layer, out_feature_class, {bin_size}, {neighborhood_size}, {time_step_interval}, {time_step_alignment}, {time_step_reference})
Parámetro | Explicación | Tipo de datos |
point_layer | La clase de entidad de punto para la que se realizará el análisis de puntos calientes. | Feature Layer |
out_feature_class | La clase de entidad de salida con los resultados de la puntuación z y el valor p. | Feature Class |
bin_size (Opcional) | El intervalo de distancia que representa el tamaño de bin y las unidades en las que se consolidará la point_layer. El intervalo de distancia debe tener una unidad lineal. | Linear Unit |
neighborhood_size (Opcional) | La extensión espacial de la vecindad de análisis. Este valor determina las entidades que se analizan conjuntamente para evaluar el clustering local. | Linear Unit |
time_step_interval (Opcional) | El intervalo que se utilizará para el periodo de tiempo. Este parámetro solo se utiliza si la función de tiempo está habilitada para point_layer. | Time Unit |
time_step_alignment (Opcional) | Especifica cómo se alinearán los periodos de tiempo . Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo.
| String |
time_step_reference (Opcional) | La hora que se utilizará para alinear los periodos de tiempo e intervalos de tiempo. Este parámetro solo se utiliza si la función de tiempo está habilitada para point_layer. | Date |
Muestra de código
El siguiente script de la ventana de Python muestra cómo utilizar la herramienta FindHotSpots.
#-------------------------------------------------------------------------------
# Name: FindHotSpots.py
# Description: Find Hots Spots of 311 calls for bins of 500 meters looking at
# neighbors within 1 kilometers. Complete the analysis for each month.
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/Calls311.gdb"
# Set local variables
inFeatures = "https://sampleserver6.arcgisonline.com/arcgis/rest/services/SF311/FeatureServer/0"
bins = "500 Meters"
neighborhood = "1 Kilometers"
timeStep = "1 Months"
out = "HotSpotsOF311Data"
# Execute Find Hot Spots
arcpy.gapro.FindHotSpots(inFeatures, out, bins, neighborhood, timeStep)
Entornos
Información de licenciamiento
- Basic: No
- Standard: No
- Advanced: Sí