Cómo funciona Análisis de puntos calientes (Gi* de Getis-Ord)

La herramienta Análisis de puntos calientes calcula la estadística Gi* de Getis-Ord (que se pronuncia G-i-estrella) para cada entidad en un dataset. Las puntuaciones z y los valores P resultantes indican dónde se agrupan espacialmente las entidades con valores altos o bajos. Esta herramienta funciona mediante la búsqueda de cada entidad dentro del contexto de entidades vecinas. Una entidad con un valor alto es interesante, pero es posible que no sea un punto caliente estadísticamente significativo. Para ser un punto caliente estadísticamente significativo, una entidad debe tener un valor alto y también estar rodeada por otras entidades con valores altos. La suma local para una entidad y sus vecinos se compara proporcionalmente con la suma de todas las entidades; cuando la suma local es muy diferente de la esperada, y esa diferencia es demasiado grande como para ser el resultado de una opción aleatoria, se obtiene como consecuencia una puntuación z estadísticamente significativa. Cuando se aplica la corrección FDR, la importancia estadística se ajusta para dar cuenta de la dependencia espacial y la realización de varias pruebas.

Cálculos

Cálculos matemáticos para la estadística Gi*

Interpretación

La estadística Gi* devuelta para cada entidad en el dataset es una puntuación z. Para las puntuaciones z positivas que son estadísticamente significativas, mientras más grande es la puntuación z, más intenso es el clustering de valores altos (punto caliente). Para las puntuaciones z negativas que son estadísticamente significativas, mientras más pequeña es la puntuación z, más intenso es el clustering de valores bajos (punto frío). Para obtener más información sobre cómo determinar la importancia estadística y corregir la dependencia espacial y la realización de varias pruebas, consulte ¿Qué es una puntuación z? ¿Qué es un valor p?

Output

Esta herramienta crea una nueva Clase de entidad de salida con una puntuación z, un valor p y un bin de nivel de confianza (Gi_Bin) para cada entidad en la Clase de entidad de entrada. Si hay un conjunto de selección aplicado a la Clase de entidad de entrada, solo se analizarán las entidades seleccionadas y solo ellas aparecerán en la Clase de entidad de salida.

Cuando esta herramienta se ejecuta en ArcMap, la Clase de entidad de salida se agrega automáticamente a la tabla de contenido con una representación en pantalla predeterminada aplicada al campo Gi_Bin. La representación en pantalla cálida a fría aplicada está definida por un archivo de capas en <ArcGIS Pro>\Resources\ArcToolBox\Templates\Layers. Puede volver a aplicar la representación en pantalla predeterminada, si es necesario, volviendo a aplicar la simbología de capa..

Consideraciones del Análisis de puntos calientes

Se deben considerar tres factores al realizar un análisis de puntos calientes:

  1. ¿Cuál es el Campo de análisis (Campo de entrada)? La herramienta de análisis de puntos calientes evalúa si los valores altos o bajos (por ejemplo, la cantidad de delitos, la gravedad de los accidentes o el dinero utilizado en la exportación de productos) se agrupan espacialmente. El campo que contiene esos valores es el Campo de análisis. Sin embargo, para los datos de incidentes de punto, puede estar más interesado en evaluar la intensidad del incidente que en analizar el clustering espacial de cualquier valor en particular asociado con los incidentes. En ese caso, deberá agregar los datos del incidente antes del análisis. Hay varias maneras de realizar esto:
    • Si tiene entidades de polígono para el área de estudio, puede utilizar la herramienta Unión espacial para contar el número de eventos de cada polígono. El campo resultante que contiene el número de eventos de cada polígono se convierte en el Campo de entrada para el análisis.
    • Utilice la herramienta Crear red para construir una cuadrícula de polígonos sobre las entidades de punto. A continuación, utilice la herramienta Unión espacial para contar el número de eventos que caen dentro de cada polígono de la cuadrícula. Quite los polígonos de la cuadrícula que estén fuera del área de estudio. Además, en los casos en los que varios de los polígonos de la cuadrícula dentro del área de estudio contienen cero para el número de eventos, aumente el tamaño de la cuadrícula de polígonos, si es apropiado, o quite los polígonos de la cuadrícula que tienen cero antes del análisis.
    • Como alternativa, si tiene un número de puntos coincidentes o puntos que están a una corta distancia entre sí, puede utilizar Integrar con la herramienta Capturar eventos para (1) alinear entre sí entidades que están dentro de una distancia especificada y después, (2) crear una nueva clase de entidad que contenga un punto en cada ubicación única con un atributo de cantidad asociado que indique el número de eventos/puntos alineados. Utilice el campo ICOUNT resultante como Campo de entrada para el análisis.
      Nota:

      Si le preocupa que los puntos coincidentes puedan ser registros redundantes, la herramienta Buscar idéntico le puede ayudar a localizar y eliminar los duplicados.

    Agregación de datos de incidentes
    Estrategias para la agregación de datos de incidentes
  2. ¿Qué Conceptualización de relaciones espaciales es adecuada? ¿Cuál es el mejor valor de Banda de distancia o distancia de umbral?

    La Conceptualización de relaciones espaciales recomendada (y predeterminada) para la herramienta Análisis de punto caliente (Gi* de Getis-Ord) es la Banda de distancia fija. También pueden funcionar bien la Ventana espacio-tiempo, Zona de indiferencia, Contigüidad, Vecino más próximo K y Triangulación de Delaunay. Para ver un análisis sobre las mejores prácticas y estrategias para determinar un valor de distancia del análisis, consulte Seleccionar una conceptualización de relaciones espaciales y Seleccionar una distancia fija. Para obtener más información acerca del análisis de puntos calientes espacio-tiempo, consulte Análisis espacio-tiempo.

  3. ¿Cuál es la pregunta?

    Esto puede parecer obvio, pero el modo en que construye el Campo de entrada para el análisis determina los tipos de preguntas que puede realizar. ¿Le interesa más determinar los lugares donde hay muchos incidentes o dónde se agrupan espacialmente los valores altos/bajos para un atributo en particular? Si es así, ejecute Análisis de puntos calientes en los conteos de valores o incidentes originales. Este tipo de análisis es útil particularmente para el tipo de problema de asignación de recursos. Como alternativa (o también), puede estar interesado en localizar áreas con valores altos inesperados en relación con alguna otra variable. Por ejemplo, si analiza ejecuciones hipotecarias, es probable que espere que haya más ejecuciones hipotecarias en lugares donde hay más viviendas (dicho de otra forma, de algún modo espera que la cantidad de ejecuciones hipotecarias sea una función de la cantidad de viviendas). Si divide la cantidad de ejecuciones hipotecarias por la cantidad de viviendas, y después ejecuta la herramienta Análisis de puntos calientes en esta relación, ya no pregunta ¿dónde hay muchas ejecuciones hipotecarias?, sino ¿dónde hay una gran cantidad inesperada de ejecuciones hipotecarias, dada la cantidad de viviendas? Al crear una tasa o relación antes del análisis, puede controlar ciertas relaciones esperadas (por ejemplo, la cantidad de delitos es una función de la población; la cantidad de ejecuciones hipotecarias es una función del total de viviendas) e identificar los puntos calientes/fríos inesperados.

Pautas de mejores prácticas

  • ¿La Clase de entidad de entrada contiene al menos 30 entidades? Los resultados no son confiables con menos de 30 entidades.
  • ¿Es adecuada la Conceptualización de relaciones espaciales que seleccionó? Para esta herramienta, se recomienda el método Banda de distancia fija. Para el análisis de punto caliente espacio-tiempo, consulte Seleccionar una conceptualización de relaciones espaciales.
  • ¿Es adecuada la Banda de distancia o distancia de umbral? Consulte Seleccionar una distancia fija.
    • Todas las entidades deben tener al menos un vecino.
    • Ninguna entidad debe tener todas las demás entidades como un vecino.
    • Especialmente si los valores para el Campo de entrada están sesgados, querrá que las entidades tengan aproximadamente ocho vecinos cada una. La herramienta Calcular banda de distancia a partir de recuento de vecindad se puede utilizar para buscar la distancia media desde la cual cada entidad tiene 8 vecinos.

Aplicaciones potenciales

Se pueden encontrar aplicaciones en el análisis de delitos, la epidemiología, el análisis del patrón de votación, la geografía económica, el análisis de venta minorista, el análisis de incidentes de tráfico y la información demográfica. A continuación presentamos algunos ejemplos:

  • ¿Dónde se concentra el brote de la enfermedad?
  • Los incendios de cocina, ¿dónde constituyen una proporción de incendios residenciales mayor que la esperada?
  • ¿Dónde se deben ubicar los sitios de evacuación?
  • ¿Dónde/cuándo ocurren las máximas intensidades?
  • ¿Qué ubicaciones y durante qué períodos debemos asignar más de nuestros recursos?

Recursos adicionales

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. Esri Press, 2005.

Getis, A. y J.K. Ord. 1992. "The Analysis of Spatial Association by Use of Distance Statistics" en Geographical Analysis 24(3).

Ord, J.K. and A. Getis. 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" en Geographical Analysis 27(4).

La página de recursos de estadística espacial contiene vídeos cortos, tutoriales, seminarios Web, artículos y muchos materiales más para ayudarle a empezar a trabajar con las estadísticas espaciales.

Scott, L. y N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools en ArcUser Online, abril a junio de 2005.