Buscar puntos calientes (GeoAnalytics Desktop)

Resumen

Dado un conjunto de entidades, identifica puntos calientes y puntos fríos estadísticamente significativos mediante la estadística Gi* de Getis-Ord.

Más información sobre cómo funciona el Análisis de punto caliente (Gi* de Getis-Ord)

Ilustración

Buscar puntos calientes

Uso

  • Esta herramienta identifica clusters espaciales estadísticamente significativos de muchas entidades (puntos calientes) y pocas entidades (puntos fríos). Crea una clase de entidad de salida con una puntuación z, un valor p y un bin de nivel de confianza (Gi_Bin) para cada entidad de la entrada.

  • Durante el análisis, los puntos de entrada (incidentes) se consolidan en bins de un tamaño especificado y, a continuación, se analizan para determinar los puntos calientes. Los bins consolidados deben contener diversos valores (los recuentos de puntos de un bin deben ser muy variables).

  • Las puntuaciones z y los valores p son medidas de la significancia estadística que indican si se debe rechazar la hipótesis nula usando bins agregados. Es decir, indican si el clustering espacial de valores altos o bajos observado es más marcado de lo que se espera en una distribución aleatoria de esos valores. Los campos de puntuación z y valor p no reflejan ninguna corrección deÍndice de descubrimientos falsos (FDR).

  • Una puntuación z alta y un valor p pequeño para una entidad indican una presencia intensa de incidentes de puntos. Una puntuación z negativa baja y un valor p pequeño indican una ausencia de incidentes de puntos. Mientras más alta (o más baja) sea la puntuación z, más intenso será el clustering. Una puntuación z cercana a cero indica que no hay un clustering espacial evidente.

  • La puntuación z está basada en el cálculo de la hipótesis nula de aleatorización. Para obtener más información sobre las puntuaciones z, consulte ¿Qué es una puntuación z? ¿Qué es un valor p?

  • El análisis con agrupamiento en bins requiere que su entrada esté proyectada o que el sistema de coordenadas de salida esté establecido como un sistema de coordenadas proyectadas. Si sus datos no se encuentran en un sistema de coordenadas proyectadas y no desea establecer ninguno, se usará una proyección en función de la extensión de los datos que está analizando.

  • Cuando las entidades de entrada se analizan usando periodos de tiempo, cada periodo de tiempo se analiza con independencia de las entidades que quedan fuera de él.

  • El parámetro Referencia de periodo de tiempo puede ser un valor de fecha y hora o simplemente un valor de fecha; no puede ser solo un valor de hora.

  • Esta herramienta de geoprocesamiento se basa en Spark. El análisis se completa en su equipo de escritorio utilizando varios núcleos en paralelo. Consulte Consideraciones acerca de las herramientas de GeoAnalytics Desktop para obtener más información acerca de la ejecución de análisis.

  • Al ejecutar herramientas de GeoAnalytics Desktop, el análisis se completa en su equipo de escritorio. Para un rendimiento óptimo, los datos deben estar disponibles en su escritorio. Si utiliza una capa de entidades alojada, se recomienda utilizar ArcGIS GeoAnalytics Server. Si sus datos no están almacenados localmente, se tardará más tiempo en ejecutar una herramienta. Para utilizar ArcGIS GeoAnalytics Server con el fin de realizar un análisis, consulte GeoAnalytics Tools.

  • Se puede completar un análisis similar usando lo siguiente:

Sintaxis

arcpy.gapro.FindHotSpots(point_layer, out_feature_class, {bin_size}, {neighborhood_size}, {time_step_interval}, {time_step_alignment}, {time_step_reference})
ParámetroExplicaciónTipo de datos
point_layer

La clase de entidad de punto para la que se realizará el análisis de puntos calientes.

Feature Layer
out_feature_class

La clase de entidad de salida con los resultados de la puntuación z y el valor p.

Feature Class
bin_size
(Opcional)

El intervalo de distancia que representa el tamaño de bin y las unidades en las que se consolidará la point_layer. El intervalo de distancia debe tener una unidad lineal.

Linear Unit
neighborhood_size
(Opcional)

La extensión espacial de la vecindad de análisis. Este valor determina las entidades que se analizan conjuntamente para evaluar el clustering local.

Linear Unit
time_step_interval
(Opcional)

El intervalo que se utilizará para el periodo de tiempo. Este parámetro solo se utiliza si la función de tiempo está habilitada para point_layer.

Time Unit
time_step_alignment
(Opcional)

Especifica cómo se alinearán los periodos de tiempo . Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo.

  • END_TIMELos periodos de tiempo se alinearán con el último evento en el tiempo y se agregarán hacia atrás en el tiempo.
  • START_TIMELos periodos de tiempo se alinearán con el primer evento en el tiempo y se agregarán hacia delante en el tiempo. Esta es la opción predeterminada.
  • REFERENCE_TIMELos periodos de tiempo se alinearán con una fecha u hora especificada. Si todos los puntos de las entidades de entrada tienen una marcadetiempo mayor que el tiempo de referencia especificado (o si es exactamente el punto de tiempo inicial de las entidades de entrada), el intervalo del paso de tiempo empezará en ese instante de referencia y se agregará hacia delante en el tiempo (como sucede con la alineación Tiempo Inicial). Si todos los puntos de las entidades de entrada tienen una marca de tiempo menor que la referencia de tiempo especificada (o si es exactamente el punto de tiempo final de las entidades de entrada), el intervalo del paso de tiempo finalizará en ese instante de referencia y se agregará hacia atrás en el tiempo (como sucede con la alineación Tiempo de finalización). Si el tiempo de referencia especificado está en la mitad de la extensión de tiempo de los datos, se creará un intervalo de periodo de tiempo que terminará por el tiempo de referencia indicado (como sucede con la alineación Tiempo de finalización). Se crearán intervalos adicionales tanto antes como después del tiempo de referencia hasta que se haya cubierto toda la extensión de tiempo de los datos.
String
time_step_reference
(Opcional)

La hora que se utilizará para alinear los periodos de tiempo e intervalos de tiempo. Este parámetro solo se utiliza si la función de tiempo está habilitada para point_layer.

Date

Muestra de código

Ejemplo de FindHotSpots (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la herramienta FindHotSpots.

#-------------------------------------------------------------------------------
# Name: FindHotSpots.py
# Description: Find Hots Spots of 311 calls for bins of 500 meters looking at 
# neighbors within 1 kilometers. Complete the analysis for each month. 
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/Calls311.gdb"
# Set local variables
inFeatures = "https://sampleserver6.arcgisonline.com/arcgis/rest/services/SF311/FeatureServer/0"
bins = "500 Meters"
neighborhood = "1 Kilometers"
timeStep = "1 Months"
out = "HotSpotsOF311Data"
# Execute Find Hot Spots
arcpy.gapro.FindHotSpots(inFeatures, out, bins, neighborhood, timeStep)

Información de licenciamiento

  • Basic: No
  • Standard: No
  • Advanced: Sí

Temas relacionados