Cómo funciona Autocorrelación espacial (I de Moran global)

La herramienta Autocorrelación espacial (I de Moran global) mide la autocorrelación espacial basándose simultáneamente en las ubicaciones y los valores de las entidades. Dado un conjunto de entidades y un atributo asociado, evalúa si el patrón expresado está agrupado, disperso o es aleatorio. La herramienta calcula el valor del índice I de Moran y tanto una puntuación z como un valor p para evaluar la importancia de dicho índice. Los valores P son aproximaciones numéricas del área bajo la curva para una distribución conocida, limitada por la estadística de prueba.

Cálculos

Matemáticas utilizadas para calcular la I de Moran global

Ver matemáticas adicionales para I de Moran global

Más arriba se muestran los cálculos en los que se basa la estadística I de Moran global. La herramienta calcula la media y la varianza del atributo evaluado. A continuación, para el valor de cada entidad, resta la media, creando una desviación de la media. Los valores de desviación de todas las entidades vecinas (características dentro de la banda de distancia especificada, por ejemplo) se multiplican para crear un producto cruzado. El numerador de la estadística I de Moran global incluye estos productos cruzados sumados. Supongamos que las entidades A y B son vecinas y que la media de todos los valores de las entidades es 10. La gama de posibles resultados de productos cruzados es la siguiente:

Valores de la entidadDesviacionesProductos cruzados

A=50

B=40

40

30

1200

A=8

B=6

-2

-4

8

A=20

B=2

10

-8

-80

Cuando los valores de las entidades vecinas son ambos mayores que la media o ambos menores que la media, el producto cruzado será positivo. Cuando un valor es menor que la media y el otro es mayor que la media, el producto cruzado será negativo. En todos los casos, cuanto mayor sea la desviación de la media, mayor será el resultado del producto cruzado. Si los valores del dataset tienden a agruparse espacialmente (los valores altos se agrupan cerca de otros valores altos; los valores bajos se agrupan cerca de otros valores bajos), el Índice de Moran será positivo. Cuando los valores altos expulsan a otros valores altos y tienden a estar cerca de valores bajos, el índice será negativo. Si los valores positivos del producto cruzado equilibran los valores negativos del producto cruzado, el índice se aproximará a cero. El numerador se normaliza por la varianza, de modo que los valores del índice estén comprendidos entre -1,0 y +1,0 (para las excepciones, véase la sección Información adicional).

Después de calcular el valor del índice, la herramienta calcula el valor del índice esperado. A continuación, se comparan los valores de los índices esperado y observado. Teniendo en cuenta el número de entidades del dataset y la varianza de los valores de los datos en general, la herramienta calcula una puntuación z y un valor p que indican si esta diferencia es estadísticamente significativa o no. Los valores del índice no pueden interpretarse directamente; solamente pueden interpretarse en el contexto de la hipótesis nula.

Interpretación

Se trata de una estadística inferencial, lo que significa que los resultados del análisis se interpretan siempre en el contexto de su hipótesis nula. Para la estadística I de Moran global, la hipótesis nula establece que el atributo analizado se distribuye aleatoriamente entre las entidades de su área de estudio; los procesos espaciales que promueven el patrón observado de valores es el azar. Imagine que puede recoger los valores del atributo que está analizando y arrojarlos sobre sus entidades, dejando que cada valor caiga donde caiga. Este proceso (recoger y arrojar los valores) es un ejemplo de proceso espacial aleatorio.

Cuando el valor p devuelto por esta herramienta es estadísticamente significativo, puede rechazar la hipótesis nula. La siguiente tabla resume la interpretación de los resultados:

El valor P no es estadísticamente significativo.

No puede rechazar la hipótesis nula. Es muy posible que la distribución espacial de los valores de las entidades sea el resultado de procesos espaciales aleatorios. El patrón espacial observado de los valores de las entidades podría muy bien ser una de las numerosísimas versiones posibles de la aleatoriedad espacial completa (RSE).

El valor P es estadísticamente significativo y la puntuación z es positiva.

Puede rechazar la hipótesis nula. La distribución espacial de los valores altos y los bajos en el dataset está más agrupada espacialmente de lo que se esperaría si los procesos espaciales subyacentes fueran aleatorios.

El valor P es estadísticamente significativo y la puntuación z es negativa.

Puede rechazar la hipótesis nula. La distribución espacial de valores altos y bajos del dataset está más dispersa espacialmente de lo que se esperaría si los procesos espaciales subyacentes fuesen aleatorios. Un patrón espacial disperso suele reflejar algún tipo de proceso competitivo: una entidad con un valor alto rechaza a otras entidades con valores altos; del mismo modo, una entidad con un valor bajo rechaza a otras entidades con valores bajos.

Nota:

La hipótesis nula de las herramientas Clustering alto/bajo (G general) y Autocorrelación espacial (I de Moran global) es aleatoriedad espacial completa. Sin embargo, la interpretación de las puntuaciones z de la herramienta Clustering alto/bajo (G general) es diferente.

Salida

La herramienta Autocorrelación espacial devuelve cinco valores: el índice I de Moran, el índice esperado, la varianza, la puntuación z y el valor P. La herramienta ofrece estos valores como mensajes de geoprocesamiento y como valores de salida derivados para su uso en modelos o scripts. Opcionalmente, la herramienta creará un informe como archivo .html con un resumen gráfico de los resultados. La ruta al informe se incluye con los mensajes que resumen los parámetros de la herramienta. Haga clic en la ruta para abrir el archivo de informe.

Mejores prácticas

Al utilizar esta herramienta, deben tenerse en cuenta las siguientes consideraciones:

  • El valor del parámetro Clase de entidad de entrada debe contener como mínimo 30 entidades. Los resultados no serán fiables con menos de 30 entidades.

  • Asegúrese de que el valor del parámetro Conceptualización de relaciones espaciales especificado es adecuado.

    Más información sobre las prácticas recomendadas para seleccionar una conceptualización de relaciones espaciales

  • Asegúrese de que el valor del parámetro Banda de distancia o Distancia de umbral especificado es el adecuado. Lo siguiente debe ser verdadero:
    • Todas las entidades deben tener al menos un vecino.
    • Ninguna entidad debe tener todas las otras entidades como un vecino.
    • Si los valores del parámetro Campo de entrada están sesgados, las entidades deben tener unos ocho vecinos cada una.
  • Para las entidades de polígono de entrada, deberá estandarizar prácticamente siempre.

Información adicional

Los resultados de la herramienta Análisis de puntos calientes (Gi* de Getis-Ord) indican puntos calientes estadísticamente significativos. Los resultados de esta herramienta pueden no ser estadísticamente significativos. Las estadísticas globales de la herramienta Autocorrelación espacial (I de Moran global) evalúan el patrón general y la tendencia de sus datos. Son más efectivas cuando el patrón espacial es consistente en toda el área de estudio. Las estadísticas locales (como la herramienta Análisis de puntos calientes (Getis-Ord Gi*)) evalúan cada entidad en el contexto de entidades vecinas y comparan la situación local con la global. Considere un ejemplo. Cuando calcula una media o un promedio para un conjunto de valores, también está calculando una estadística global. Si todos los valores se acercan a 20, el valor medio también lo hará y ese resultado sería una muy buena representación y resumen del dataset como conjunto. No obstante, si la mitad de los valores se acercan a 1 y la otra mitad se acercan a 100, el valor medio se acercará a 50. Es posible que no haya valores de datos cerca de 50, por lo que el valor medio no es una buena representación ni resumen del dataset como conjunto. Si crea un histograma de los valores de los datos, podrá ver la distribución de dos modelos. Del mismo modo, las estadísticas espaciales globales, incluida la herramienta Autocorrelación espacial (I de Moran global), son más efectivas cuando los procesos espaciales que se miden son consistentes en toda el área de estudio. Por lo tanto, los resultados serán una buena representación y resumen del patrón espacial general. Para más información, véase The Analysis of Spatial Association by Use of Distance Statistics y el análisis de los PEID que presentan.

Los resultados de esta herramienta son diferentes de los de la herramienta Autocorrelación espacial (I de Moran global). Estas dos herramientas miden patrones espaciales diferentes. Véase Interpretación de los resultados de clustering alto/bajo (Getis-Ord General G) para obtener más información.

Los resultados de las puntuaciones z o los valores p no son comparables entre las distintas áreas de estudio. Sin embargo, cuando el área de estudio es fija (por ejemplo, todos los análisis corresponden a condados de California), el valor del parámetro Campo de entrada es comparable (por ejemplo, todos los análisis implican algún tipo de recuento de población) y los parámetros de la herramienta son los mismos, puede comparar puntuaciones z estadísticamente significativas para hacerse una idea de la intensidad del clustering espacial, o de la dispersión espacial o para comprender mejor las tendencias a lo largo del tiempo. También puede ejecutar el análisis para una serie de valores crecientes de los parámetros Banda de distancia o Distancia de umbral para ver la distancia o escala en la que los procesos que promueven el clustering espacial son más pronunciados.

En general, el Índice de Moran global está delimitado por -1,0 y 1,0. Este es siempre el caso cuando las ponderaciones están estandarizadas por filas. Si no estandariza las ponderaciones en filas, puede haber casos en los que el valor del índice quede fuera del intervalo de -1,0 a 1,0, lo que indica un problema con la configuración de los parámetros. Los problemas más frecuentes son los siguientes:

  • El valor del parámetro Campo de entrada está muy sesgado (cree un histograma de los valores de los datos para verlo), y el valor del parámetro Conceptualización de relaciones espaciales o Banda de distancia es tal que algunas entidades tienen muy pocos vecinos. La estadística I de Moran global es asintóticamente normal, lo que significa que para datos sesgados, deseará que cada entidad tenga, al menos, ocho vecinos. El valor predeterminado calculado para el parámetro Banda de distancia o Distancia de umbral garantiza que cada entidad tenga, al menos, un vecino, pero ello podría no ser suficiente, sobre todo cuando los valores del parámetro Campo de entrada están muy sesgados.
  • Si se utiliza la opción Distancia Inversa del parámetro Conceptualización de relaciones espaciales, y las distancias invertidas son muy pequeñas.
  • El parámetro Estandarización no está configurado en la opción Fila, pero debería estarlo. Siempre que se hayan agregado sus datos, a menos que el esquema de agregación se refiera directamente al campo que está analizando, especifique la opción Fila.

Aplicaciones de ejemplo

A continuación, se presentan ejemplos de aplicación de esta herramienta:

  • Identifique una distancia de vecindad apropiada para una variedad de métodos de análisis espacial encontrando la distancia donde la autocorrelación espacial sea más fuerte.
  • Medir las tendencias generales de la segregación étnica o racial a lo largo del tiempo: ¿aumenta o disminuye la segregación?
  • Resuma la difusión de una idea, enfermedad o tendencia en el espacio y el tiempo: ¿la idea, enfermedad o tendencia permanece aislada y concentrada o se extiende y se hace más difusa?

Recursos adicionales

Los siguientes libros y artículos de revistas contienen más información sobre esta herramienta:

Getis, Arthur y J. K. Ord. «The Analysis of Spatial Association by Use of Distance Statistics». Geographical Analysis 24, n.º 3. 1992.

Goodchild, Michael F. Spatial Autocorrelation. Catmog 47, Geo Books. 1986.

Griffith, Daniel. Spatial Autocorrelation: A Primer. Resource Publications in Geography, Association of American Geographers. 1987.

The ESRI Guide to GIS Analysis, Volume 2. Esri Press, 2005.