Cómo funciona Análisis de puntos calientes (Gi* de Getis-Ord)

La herramienta Análisis de puntos calientes (Getis-Ord Gi*) calcula la estadística Gi* de Getis-Ord (que se pronuncia G-i-estrella) para cada entidad en un dataset. Las puntuaciones z y los valores P resultantes indican dónde se agrupan espacialmente las entidades con valores altos o bajos. Esta herramienta evalúa cada entidad dentro del contexto de entidades vecinas. Una entidad con un valor alto es interesante, pero es posible que no sea un punto caliente estadísticamente significativo. Para ser un punto caliente estadísticamente significativo, una entidad debe tener un valor alto y estar rodeada por otras entidades con valores altos. La suma local para una entidad y sus vecinos se compara proporcionalmente con la suma de todas las entidades. Cuando la suma local es muy diferente de la esperada, y esa diferencia es demasiado grande como para ser el resultado de una opción aleatoria, se obtiene como consecuencia una puntuación z estadísticamente significativa. Cuando se aplica la corrección FDR, la importancia estadística se ajusta para dar cuenta de la dependencia espacial y la realización de varias pruebas.

Cálculos

En la siguiente imagen se muestran los cálculos para la estadística Getis-Ord Gi*:

Cálculos matemáticos para la estadística Gi*

Interpretación

La estadística Gi* devuelta para cada entidad en el dataset es una puntuación z. Para las puntuaciones z positivas que son estadísticamente significativas, cuanto mayor sea la puntuación z, más intenso será el clustering de valores altos (puntos calientes). Para las puntuaciones z negativas que son estadísticamente significativas, cuanto más pequeña sea la puntuación z, más intenso será el clustering de valores bajos (punto frío). Para obtener más información sobre cómo determinar la importancia estadística y corregir la dependencia espacial y la realización de varias pruebas, consulte ¿Qué es una puntuación z? ¿Qué es un valor P?.

Salida

Esta herramienta crea una clase de entidad de salida con una puntuación z, un valor p y un bin de nivel de confianza (Gi_Bin) para cada entidad de entrada.

Una vez finalizada la ejecución de la herramienta, la clase de entidad de salida se agrega al mapa con la representación aplicada al campo Gi_Bin.

Consideraciones del Análisis de puntos calientes

A la hora de realizar un análisis de puntos calientes, tenga en cuenta lo siguiente:

  • La herramienta evalúa si los valores altos o bajos (por ejemplo, la cantidad de delitos, la gravedad de los accidentes o el dinero utilizado en la exportación de productos) se agrupan espacialmente. El campo que contiene dichos valores es el campo de análisis. Sin embargo, para los datos de incidentes de punto, puede estar más interesado en evaluar la intensidad del incidente que en analizar el clustering espacial de cualquier valor en particular asociado con los incidentes. En tal caso, agregue los datos del incidente antes de ejecutar el análisis realizando una de las siguientes acciones:
    • Si tiene entidades de polígono para el área de estudio, utilice la herramienta Unión espacial para contar el número de eventos de cada polígono. El campo resultante que contiene el número de eventos en cada polígono se convierte en el valor del parámetro Campo de entrada para la herramienta Análisis de puntos calientes (Getis-Ord Gi*).
    • Utilice la herramienta Crear red o Generar teselación para crear una cuadrícula de polígonos encima de las entidades de punto. A continuación, utilice la herramienta Unión espacial para contar el número de eventos de cada polígono de la cuadrícula. Quite los polígonos de la cuadrícula que se encuentren fuera del área de estudio. Además, en los casos en los que varios de los polígonos de la cuadrícula dentro del área de estudio contienen cero para el número de eventos, aumente el tamaño de la cuadrícula de polígonos, si es apropiado, o quite los polígonos de la cuadrícula que tienen cero.
    • Si tiene un número de puntos coincidentes o puntos que están a una corta distancia entre sí, utilice la herramienta Integrar con la herramienta Capturar eventos para alinear entre sí entidades que están dentro de una distancia especificada y después y para crear una nueva clase de entidad que contenga un punto en cada ubicación única con un atributo de cantidad asociado que indique el número de eventos (puntos alineados). Utilice el campo ICOUNT resultante como valor del parámetro Campo de entrada para la herramienta Análisis de puntos calientes (Getis-Ord Gi*).
      Nota:

      Si los puntos coincidentes pueden ser registros redundantes, utilice la herramienta Buscar idéntico para localizar y eliminar los duplicados.

    En la siguiente imagen se muestran ejemplos de uso de las herramientas mencionadas para agregar datos sobre incidentes:
    Ejemplos de agregación de datos de incidentes
    Se muestran estrategias para la agregación de datos de incidentes.
  • El valor del parámetro Conceptualización de relaciones espaciales recomendado (y predeterminado) para la herramienta Análisis de punto caliente (Gi* de Getis-Ord) es la Banda de distancia fija. También pueden funcionar bien las opciones Ventana espacio-tiempo, Zona de indiferencia, Vecino más próximo K y Triangulación de Delaunay. Para ver un análisis sobre las mejores prácticas y estrategias para determinar un valor de distancia del análisis, consulte Prácticas recomendadas para seleccionar una conceptualización de relaciones espaciales y Prácticas recomendadas para seleccionar un valor de banda de distancia fija. Para obtener más información acerca del análisis de puntos calientes espacio-tiempo, consulte Análisis clúster espacio-tiempo.

  • El campo de entrada determina los tipos de preguntas que puede realizar. Si lo que más le interesa es determinar los lugares donde hay muchos incidentes o dónde se agrupan espacialmente los valores altos y bajos para un atributo en particular, ejecute la herramienta Análisis de puntos calientes (Getis-Ord Gi*) en los valores o recuentos de incidentes orginales. Este tipo de análisis es útil particularmente para los problemas de asignación de recursos. Como alternativa (o también), puede estar interesado en localizar áreas con valores altos inesperados en relación con alguna otra variable. Por ejemplo, si analiza ejecuciones hipotecarias, es de esperar que haya más ejecuciones hipotecarias en lugares donde hay más viviendas (es decir, de algún modo se espera que la cantidad de ejecuciones hipotecarias sea una función del número de viviendas). Si divide la cantidad de ejecuciones hipotecarias por el número de viviendas, y después ejecuta la herramienta Análisis de puntos calientes (Getis-Ord Gi*) en esta relación, ya no se preguntará dónde hay muchas ejecuciones hipotecarias. En cambio, se preguntará dónde hay un número inesperadamente elevado de ejecuciones hipotecarias, teniendo en cuenta el número de viviendas. Al crear una tasa o relación antes de ejecutar el análisis, puede controlar ciertas relaciones esperadas (por ejemplo, la cantidad de delitos es una función de la población; la cantidad de ejecuciones hipotecarias es una función del total de viviendas) e identificar los puntos calientes y fríos inesperados.

Mejores prácticas

A continuación se describen las prácticas recomendadas para utilizar la herramienta Análisis de puntos calientes (Getis-Ord Gi*):

  • El valor del parámetro Clase de entidad de entrada debe tener como mínimo 30 entidades. Los resultados no son confiables con menos de 30 entidades.
  • Especifique el valor apropiado para el parámetro Conceptualización de relaciones espaciales. Para esta herramienta, se recomienda la opción Banda de distancia fija. Para el análisis de puntos calientes de espacio-tiempo, consulte Prácticas recomendadas para seleccionar una conceptualización de relaciones espaciales.
  • Especifique el valor apropiado para el parámetro Banda de sitancia o distancia de umbral. Consulte Banda de distancia o distancia de umbral para obtener más información.
    • Todas las entidades deben tener al menos un vecino.
    • Ninguna entidad debe tener todas las demás entidades como un vecino.
    • Las entidades deben tener unos ocho vecinos cada una, especialmente si los valores del parámetro Campo de entrada están sesgados. Puede utilizar la herramienta Calcular banda de distancia a partir de recuento de vecindad para buscar la distancia media desde la cual cada entidad tiene ocho vecinos.

Potenciales aplicaciones

Se pueden encontrar aplicaciones en el análisis de delitos, la epidemiología, el análisis del patrón de votación, la geografía económica, el análisis de venta minorista, el análisis de incidentes de tráfico y la información demográfica, por ejemplo. Puede responder a los siguientes tipos de preguntas:

  • ¿Dónde se concentra el brote de la enfermedad?
  • Los incendios de cocina, ¿dónde constituyen una proporción de incendios residenciales mayor que la esperada?
  • ¿Dónde se deben ubicar los sitios de evacuación?
  • ¿Dónde y cuándo ocurren las máximas intensidades?
  • ¿Qué lugares y durante qué periodos deben asignarse los recursos?

Recursos adicionales

Para más información sobre estadísticas espaciales, consulte los siguientes recursos:

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. Esri Press, 2005.

Getis, A. y J.K. Ord. 1992."The Analysis of Spatial Association by Use of Distance Statistics" in Geographical Analysis 24(3).

Ord, J.K. y A. Getis. 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" en Geographical Analysis 27(4).

La página de recursos de estadística espacial contiene vídeos cortos, tutoriales, seminarios Web, artículos y muchos materiales más para ayudarle a empezar a trabajar con las estadísticas espaciales.

Scott, L. y N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools en ArcUser Online, abril a junio de 2005.