Buscar puntos calientes (Geoanálisis)

Resumen

Dado un conjunto de entidades, identifica puntos calientes y puntos fríos estadísticamente significativos mediante la estadística Gi* de Getis-Ord.

Más información sobre cómo funciona el Análisis de punto caliente (Gi* de Getis-Ord)

Ilustración

Buscar puntos calientes

Uso

  • Esta herramienta identifica clusters espaciales estadísticamente significativos de muchas entidades (puntos calientes) y pocas entidades (puntos fríos). Crea una clase de entidad de salida con una puntuación z, un valor p y un bin de nivel de confianza (Gi_Bin) para cada entidad de la entrada.

  • Durante el análisis, los puntos de entrada (incidentes) se consolidan en bins de un tamaño especificado y, a continuación, se analizan para determinar los puntos calientes. Los bins consolidados deben contener diversos valores (los recuentos de puntos de un bin deben ser muy variables).

  • Las puntuaciones z y los valores p son medidas de la significancia estadística que indican si se debe rechazar la hipótesis nula usando bins agregados. Es decir, indican si el clustering espacial de valores altos o bajos observado es más marcado de lo que se espera en una distribución aleatoria de esos valores. Los campos de puntuación z y valor p no reflejan ninguna corrección deÍndice de descubrimientos falsos (FDR).

  • Una puntuación z alta y un valor p pequeño para una entidad indican una presencia intensa de incidentes de puntos. Una puntuación z negativa baja y un valor p pequeño indican una ausencia de incidentes de puntos. Mientras más alta (o más baja) sea la puntuación z, más intenso será el clustering. Una puntuación z cercana a cero indica que no hay un clustering espacial evidente.

  • La puntuación z está basada en el cálculo de la hipótesis nula de aleatorización. Para obtener más información sobre las puntuaciones z, consulte ¿Qué es una puntuación z? ¿Qué es un valor p?

  • Buscar puntos calientes requiere que la capa de entrada se haya proyectado o que el sistema de coordenadas de salida sea un sistema de coordenadas proyectadas.

  • Cuando las entidades de entrada se analizan usando periodos de tiempo, cada periodo de tiempo se analiza con independencia de las entidades que quedan fuera de él.

  • El parámetro Referencia de periodo de tiempo puede ser un valor de fecha y hora o simplemente un valor de fecha; no puede ser solo un valor de hora.

  • Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en su GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.

  • Al ejecutar herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para su GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Por lo tanto, se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.

    Más información acerca del uso compartido de datos en el portal

    Más información sobre cómo crear un archivo compartido de Big Data mediante Server Manager

  • Se puede completar un análisis similar usando lo siguiente:

Sintaxis

arcpy.geoanalytics.FindHotSpots(point_layer, output_name, {bin_size}, {neighborhood_size}, {time_step_interval}, {time_step_alignment}, {time_step_reference}, {data_store})
ParámetroExplicaciónTipo de datos
point_layer

La clase de entidad de punto para la que se realizará el análisis de puntos calientes.

Feature Set
output_name

El nombre de la capa de salida con los resultados de la puntuación z y el valor p.

String
bin_size
(Opcional)

El intervalo de distancia que representa el tamaño de bin y las unidades en las que se consolidará la point_layer. El intervalo de distancia debe tener una unidad lineal.

Linear Unit
neighborhood_size
(Opcional)

La extensión espacial de la vecindad de análisis. Este valor determina las entidades que se analizan conjuntamente para evaluar el clustering local.

Linear Unit
time_step_interval
(Opcional)

El intervalo que se utilizará para el periodo de tiempo. Este parámetro solo se utiliza si la función de tiempo está habilitada para point_layer.

Time Unit
time_step_alignment
(Opcional)

Especifica cómo se alinearán los periodos de tiempo . Este parámetro solo está disponible si los puntos de entrada tienen el tiempo habilitado y representan un instante en el tiempo.

  • END_TIMELos periodos de tiempo se alinearán con el último evento en el tiempo y se agregarán hacia atrás en el tiempo.
  • START_TIMELos periodos de tiempo se alinearán con el primer evento en el tiempo y se agregarán hacia delante en el tiempo. Esta es la opción predeterminada.
  • REFERENCE_TIMELos periodos de tiempo se alinearán con una fecha u hora especificada. Si todos los puntos de las entidades de entrada tienen una marcadetiempo mayor que el tiempo de referencia especificado (o si es exactamente el punto de tiempo inicial de las entidades de entrada), el intervalo del paso de tiempo empezará en ese instante de referencia y se agregará hacia delante en el tiempo (como sucede con la alineación Tiempo Inicial). Si todos los puntos de las entidades de entrada tienen una marca de tiempo menor que la referencia de tiempo especificada (o si es exactamente el punto de tiempo final de las entidades de entrada), el intervalo del paso de tiempo finalizará en ese instante de referencia y se agregará hacia atrás en el tiempo (como sucede con la alineación Tiempo de finalización). Si el tiempo de referencia especificado está en la mitad de la extensión de tiempo de los datos, se creará un intervalo de periodo de tiempo que terminará por el tiempo de referencia indicado (como sucede con la alineación Tiempo de finalización). Se crearán intervalos adicionales tanto antes como después del tiempo de referencia hasta que se haya cubierto toda la extensión de tiempo de los datos.
String
time_step_reference
(Opcional)

La hora que se utilizará para alinear los periodos de tiempo e intervalos de tiempo. Este parámetro solo se utiliza si la función de tiempo está habilitada para point_layer.

Date
data_store
(Opcional)

Especifica el ArcGIS Data Store en el que se guardará la salida. La predeterminada es SPATIOTEMPORAL_DATA_STORE. Todos los resultados almacenados en un big data store espaciotemporal se almacenarán en WGS84. Los resultados almacenados en un data store relacional mantendrán su sistema de coordenadas.

  • SPATIOTEMPORAL_DATA_STORELa salida se almacenará en un big data store espaciotemporal. Esta es la opción predeterminada.
  • RELATIONAL_DATA_STORELa salida se almacenará en un data store relacional.
String

Salida derivada

NombreExplicaciónTipo de datos
output

Los puntos calientes estadísticamente significativos.

Conjunto de entidades

Muestra de código

FindHotSpots (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la herramienta FindHotSpots.

#-------------------------------------------------------------------------------
# Name: FindHotSpots.py
# Description: Find Hots Spots of 311 calls for bins of 500 meters looking at neighbors withing 1 kilometers. Complete the analysis for each month. 
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inFeatures = "https://sampleserver6.arcgisonline.com/arcgis/rest/services/SF311/FeatureServer/0"
bins = "500 Meters"
neighborhood = "1 Kilometers"
timeStep = "1 Months"
outFS = "HotSpotsOF311Data"
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute Find Hot Spots
arcpy.geoanalytics.FindHotSpots(inFeatures, outFS, bins, neighborhood, timeStep, 
                                None, None, dataStore)

Entornos

Sistema de coordenadas de salida

El sistema de coordenadas que se usará para el análisis. El análisis se completará en el sistema de coordenadas de entrada salvo que este parámetro especifique otra opción. Para las GeoAnalytics Tools, los resultados finales se almacenarán en el data store espaciotemporal en WGS84.

Información de licenciamiento

  • Basic: Requiere ArcGIS GeoAnalytics Server
  • Standard: Requiere ArcGIS GeoAnalytics Server
  • Advanced: Requiere ArcGIS GeoAnalytics Server

Temas relacionados