Autocorrelación espacial (I de Moran global) (Estadística espacial)

Resumen

Mide la autocorrelación espacial en función de las ubicaciones de entidades y los valores de atributo mediante la estadística I de Moran global.

Más información sobre cómo funciona Autocorrelación espacial (I de Moran global)

Ilustración

Ilustración de herramienta Autocorrelación espacial

Uso

  • La herramienta Autocorrelación espacial devuelve cinco valores: el índice I de Moran, el índice esperado, la varianza, la puntuación z y el valor P. Estos valores se escriben como mensajes en la parte inferior del panel Geoprocesamiento durante el uso de la herramienta y se transmiten como valores de salida derivados para su uso potencial en modelos o secuencias de comandos. Para acceder a los mensajes, pase el cursor sobre la barra de progreso y haga clic en el botón emergente o expanda la sección de detalles de los mensajes del panel Geoprocesamiento. También puede acceder a los mensajes y detalles de una herramienta ejecutada anteriormente a través del historial de geoprocesamiento. Puede crear un informe HTML con un resumen gráfico de los resultados mediante el uso de esta herramienta. La ruta al informe se incluirá con los mensajes que resumen los parámetros de la herramienta. Haga clic en esa ruta para abrir el archivo de informe.

  • Para un conjunto de entidades y un atributo asociado, esta herramienta evalúa si el patrón expresado está agrupado, disperso o es aleatorio. Cuando la puntuación z o el valor p indican una significancia estadística, un valor positivo del índice I de Moran indica una tendencia hacia el clustering mientras que un valor negativo del índice I de Moran indica una tendencia hacia la dispersión.

  • Esta herramienta calcula una puntuación z y un valor p que le indican si puede rechazar las hipótesis nulas. En este caso, la hipótesis nula establece que los valores de las entidades no están espacialmente correlacionados.

  • La puntuación z y el valor p son medidas de la significancia estadística. Estos valores pueden ayudarle a determinar si rechazar la hipótesis nula. Para esta herramienta, la hipótesis nula establece que los valores asociados con entidades están distribuidos en forma aleatoria.

  • El valor del parámetro Campo de entrada debe contener una variedad de valores. La operación matemática para esta estadística requiere variación en la variable analizada; no se puede resolver si todos los valores de entrada son 1, por ejemplo. Si desea utilizar esta herramienta para analizar el patrón espacial de los datos de incidentes, plantéese agregar los datos de incidentes. También puede utilizar la herramienta Análisis de puntos calientes optimizado para analizar el patrón espacial de datos de incidentes.

    Nota:

    Los datos de incidentes son puntos que representan eventos (delitos, accidentes de tráfico) u objetos (árboles, tiendas) donde el foco se centra en la presencia o ausencia en lugar de un atributo medido asociado a cada punto.

  • Cuando el valor del parámetro Clase de entidad de entrada no está proyectado (es decir, cuando las coordenadas están en grados, minutos y segundos) o cuando el entorno Sistema de coordenadas de salida se establece en un sistema de coordenadas geográficas, las distancias se calculan mediante mediciones de cuerda. Las mediciones de distancia de cuerda se utilizan porque se pueden calcular rápidamente y proporcionan estimaciones buenas de las verdaderas distancias geodésicas, al menos para los puntos separados aproximadamente unos treinta 30 grados entre sí. Las distancias de cuerda se basan en un esferoide oblato. A partir de dos puntos en la superficie terrestre, la distancia de cuerda entre ellos es la longitud de una línea que atraviesa la Tierra tridimensionalmente para conectar los dos puntos. Las distancias de cuerda se informan en metros.

    Precaución:

    Asegúrese de proyectar los datos si el área de estudio se extiende más allá de 30 grados. Las distancias de cuerda no son una buena estimación de las distancias geodésicas más allá de 30 grados.

  • Cuando se utilizan distancias de cuerda en el análisis, el valor del parámetro Banda de distancia o distancia de umbral, si se especifica, debe estar en metros.

  • Los centroides de entidad se utilizan en los cálculos de distancia para las entidades de línea y polígono. Para multipuntos, polilíneas o polígonos con varias partes, el centroide se calcula utilizando el centro medio ponderado de todas las partes de entidad. La ponderación para las entidades de punto es 1, para las entidades de línea es longitud y para las entidades de polígono es área.

  • El parámetro Conceptualización de relaciones espaciales deberá reflejar relaciones inherentes entre las entidades que analiza. Cuanto más pueda modelar de manera realista cómo interactúan mutuamente las entidades en el espacio, más precisos serán sus resultados. Las recomendaciones se describen en Prácticas recomendadas para seleccionar una conceptualización de relaciones espaciales. A continuación, se ofrecen más sugerencias:

    • Cuando se utiliza la opción Banda de distancia fija, el valor del parámetro Banda de distancia o Distancia de umbral predeterminado garantizará que cada entidad tenga al menos un vecino. Es importante, pero en muchos casos este valor predeterminado no es la distancia más apropiada para el análisis. En Banda de distancia (esfera de influencia) se describen estrategias adicionales para seleccionar una escala apropiada (banda de distancia) para un análisis.

    • Cuando se utilizan las opciones Distancia inversa o Distancia inversa cuadrada y se introduce cero en el parámetro Banda de distancia o distancia de umbral, se considera que todas las entidades son vecinas de las demás entidades; cuando este parámetro se deja en blanco, se aplica la distancia predeterminada.

      Los pesos de las distancias menores que 1 se vuelven inestables cuando se invierten. Por consiguiente, a los pesos de entidades separadas por menos de 1 unidad de distancia se les da un peso de 1.

      Para las opciones de distancia inversa (Distancia inversa, Distancia inversa cuadrada y Zona de indiferencia), se asignará un peso de 1 a todos los pares de puntos coincidentes para evitar la división por cero. Esto garantiza que las entidades no sean excluidas del análisis.

  • En Python, la salida derivada de esta herramienta contiene el valor de índice I de Moran, la puntuación z, el valor p y un archivo de informe HTML, además de las entidades de entrada. Por ejemplo, si asigna el objeto Result de la herramienta a una variable denominada MoranResult, MoranResult[0] almacena el valor de índice I de Moran, MoranResult[1] almacena la puntuación z, MoranResult[2] almacena el valor p, MoranResult[3] almacena la ruta del archivo de informe HTML y MoranResult[4] almacena las entidades de entrada. Si no genera un archivo de informe HTML mediante el uso del parámetro Generar informe, la cuarta salida derivada será una cadena vacía.

  • Las opciones adicionales para el parámetro Conceptualización de relaciones espaciales, incluidas las relaciones tridimensionales y espaciotemporales, están disponibles utilizando la herramienta Generar matriz de ponderaciones espaciales. Para utilizar estas opciones adicionales, construya un archivo de matriz de ponderaciones espaciales antes del análisis; para el parámetro Conceptualización de relaciones espaciales, utilice la opción Obtener ponderaciones espaciales a partir del archivo y, para el parámetro Archivo de matriz de ponderaciones, especifique la ruta del archivo de ponderaciones espaciales que creó.

  • Las capas de mapa se pueden especificar como el valor del parámetro Clase de entidad de entrada. Al utilizar una capa con una selección, solo las entidades seleccionadas se incluirán en el análisis.

  • Si proporciona un valor de parámetro Archivo de matriz de ponderaciones con una extensión .swm, se espera que se cree un archivo de matriz de ponderaciones espaciales con la herramienta Generar matriz de ponderaciones espaciales; de lo contrario, se espera un archivo de matriz de ponderaciones espaciales con formato ASCII. En algunos casos, el comportamiento es diferente según el siguiente tipo de archivo de matriz de ponderaciones espaciales que utilice:

    • Archivo de matriz de ponderaciones espaciales con formato ASCII
      • Los pesos se utilizarán tal cual. Las relaciones de entidad a entidad que faltan se tratarán como ceros.
      • Si los pesos están estandarizados por fila, los resultados pueden ser incorrectos para los análisis en los conjuntos de selección. Para ejecutar un análisis en un conjunto de selección, convierta el archivo de ponderaciones espaciales ASCII a un archivo .swm leyendo los datos ASCII en una tabla y utilizando la opción Convertir tabla con la herramienta Generar matriz de ponderaciones espaciales.
    • Archivo de matriz de ponderaciones espaciales con formato SWM
      • Si los pesos están estandarizados por fila, se volverán a estandarizar para los conjuntos de selección; de lo contrario, los pesos se utilizarán como están.

  • La ejecución de un análisis con un archivo de matriz de ponderaciones espaciales con formato ASCII consume mucha memoria. Para los análisis de más de 5000 entidades, plantéese convertir el archivo de matriz de ponderaciones espaciales con formato ASCII en un archivo con formato SWM. Primero, coloque las ponderaciones ASCII en una tabla con formato (por ejemplo, por medio de Excel). A continuación, ejecute la herramienta Generar matriz de ponderaciones espaciales utilizando Convertir tabla para el valor del parámetro Conceptualización de relaciones espaciales. El resultado será un archivo de matriz de ponderaciones espaciales con formato .SWM.

  • Nota:

    Es posible que la memoria sea insuficiente cuando ejecuta esta herramienta. Puede ocurrir cuando los valores de los parámetros Conceptualización de relaciones espaciales y Banda de distancia o distancia de umbral especificados dan como resultado entidades con miles de vecinos. Como regla general, no defina relaciones espaciales para que las entidades tengan miles de vecinos. Todas las entidades deben tener al menos un vecino y casi todas las entidades deben tener al menos ocho vecinos.

  • Para las entidades poligonales, utilice la opción Fila para el parámetro Estandarización. La Estandarización de filas reduce la influencia cuando la cantidad de vecinos de cada entidad es una función del esquema de agregación o del proceso de muestreo, en lugar de una reflexión de la distribución espacial real de la variable que está analizando.

  • Para obtener más información sobre los parámetros de esta herramienta, consulte el tema de ayuda Modelado de relaciones espaciales.

  • Precaución:

    Sin embargo, los shapefiles no pueden almacenar valores nulos. Las herramientas u otros procedimientos que crean shapefiles a partir de otros tipos de entradas pueden almacenar o interpretar valores nulos como cero. En algunos casos, los valores nulos se almacenan como valores negativos grandes en shapefiles, lo que puede dar lugar a resultados inesperados. Consulte Consideraciones de geoprocesamiento para la salida del shapefile para obtener más información.

Parámetros

EtiquetaExplicaciónTipo de datos
Clase de entidad de entrada

La clase de entidad para la que se calculará la autocorrelación espacial.

Feature Layer
Campo de entrada

El campo numérico que se utilizará en la evaluación de la autocorrelación espacial.

Field
Generar informe
(Opcional)

Especifica si se creará un resumen gráfico del resultado como un archivo .html.

  • Activado: se creará un resumen gráfico.
  • Desactivada: no se crea un resumen gráfico. Esta es la opción predeterminada.
Boolean
Conceptualización de relaciones espaciales

Especifica cómo se definirán las relaciones espaciales entre las entidades.

  • Distancia inversaLas entidades vecinas tienen mayor influencia sobre los cálculos de una entidad de destino que las entidades que están alejadas.
  • Distancia inversa cuadradaEs lo mismo que la opción Distancia inversa, salvo en que la pendiente es más nítida, de modo que la influencia cae de una forma más rápida y solo los vecinos más cercanos de la entidad de destino ejercerán una influencia sustancial en los cálculos de dicha entidad.
  • Banda de distancia fijaCada entidad se analiza dentro del contexto de las entidades vecinas. Las entidades vecinas que se encuentran dentro de la distancia crítica especificada (valor de Banda de distancia o Distancia de umbral) reciben un peso de 1 e influyen en los cálculos de la entidad de destino. Las entidades vecinas fuera de la distancia crítica reciben un peso de cero y no tienen influencia sobre los cálculos de una entidad de destino.
  • Zona de indiferenciaLas entidades que se encuentran dentro de la distancia crítica especificada (valor de Banda de distancia o Distancia de umbral) de una entidad de destino reciben un peso de 1 e influyen en los cálculos de esa entidad. Una vez que se excede la distancia crítica, los pesos (y la influencia que una entidad vecina tiene sobre los cálculos de una entidad de destino) disminuyen con la distancia.
  • K vecinos más próximosLas entidades k más cercanas se incluyen en el análisis. El parámetro Cantidad de vecinos especifica la cantidad de vecinos (k) que se desea incluir en el análisis.
  • Solo bordes de contigüidadSolo las entidades de polígono vecinas que comparten un límite o que se superponen tendrán influencia sobre los cálculos de la entidad poligonal de destino.
  • Bordes o esquinas de contigüidadLas entidades poligonales que comparten un límite, comparten un nodo o se superponen tendrán influencia sobre los cálculos de la entidad poligonal de destino.
  • Obtener ponderaciones espaciales a partir del archivoLas relaciones espaciales vienen definidas por un archivo especificado de ponderaciones espaciales. La ruta del archivo de ponderaciones espaciales se especifica mediante el parámetro Archivo de matriz de ponderaciones.
String
Método de distancia

Especifica cómo se calcularán las distancias desde cada entidad hasta las entidades vecinas.

  • EuclidianoSe utilizará la distancia en línea recta entre dos puntos (como a vuelo de pájaro). Esta es la opción predeterminada.
  • ManhattanSe utilizará la distancia entre dos puntos medida a lo largo de los ejes en ángulos rectos (manzana). Esto se calculada sumando la diferencia (absoluta) entre las coordenadas x e y.
String
Estandarización

Especifica que se aplicará la estandarización de ponderaciones espaciales. Se recomienda la estandarización de filas siempre que la distribución de entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto.

  • NingunaNo se aplica ninguna estandarización de ponderaciones espaciales.
  • FilaLas ponderaciones espaciales se estandarizarán; cada peso se dividirá por la suma de su fila (la suma de los pesos de todas las entidades vecinas). Esta es la opción predeterminada.
String
Banda de distancia o Distancia de umbral
(Opcional)

Distancia de valor límite correspondiente a las diversas opciones de distancia inversa y distancia fija. Las entidades que están fuera del valor límite especificado para una entidad de destino se ignoran en el análisis de esa entidad. Sin embargo, para la Zona de indiferencia, la influencia de las entidades que están fuera de la distancia dada se reduce con la distancia, mientras que aquellas que están dentro del umbral de distancia se consideran por igual. El valor de distancia proporcionado debe coincidir con el del sistema de coordenadas de salida.

En las conceptualizaciones de relaciones espaciales de la distancia inversa, un valor de 0 indica que no se aplica una distancia de umbral; cuando este parámetro se deja en blanco, se calcula y se aplica un valor de umbral predeterminado. Este valor predeterminado es la distancia euclidiana, lo que garantiza que cada entidad tenga como mínimo un vecino.

Este parámetro no tiene efecto cuando se especifica la conceptualización espacial de contigüidad de polígono (Solo bordes de contigüidad o Bordes o esquinas de contigüidad) o bien Obtener ponderaciones espaciales a partir del archivo.

Double
Archivo de matriz de ponderaciones
(Opcional)

La ruta a un archivo que contenga los pesos que definen las relaciones espaciales, y potencialmente temporales entre las entidades.

File
Cantidad de vecinos
(Opcional)

Un número entero que especifica el número de vecinos que se incluirán en el análisis.

Long

Salida derivada

EtiquetaExplicaciónTipo de datos
Índice

El valor de índice de Moran.

Double
Puntuación z

La puntuación z.

Double
Valor P

El valor p.

Double
Archivo de informe

Un archivo HTML con resumen gráfico de los resultados.

File
Dataset de entrada derivado

Entidades de entrada de la herramienta.

Feature Layer

arcpy.stats.SpatialAutocorrelation(Input_Feature_Class, Input_Field, {Generate_Report}, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Weights_Matrix_File}, {number_of_neighbors})
NombreExplicaciónTipo de datos
Input_Feature_Class

La clase de entidad para la que se calculará la autocorrelación espacial.

Feature Layer
Input_Field

El campo numérico que se utilizará en la evaluación de la autocorrelación espacial.

Field
Generate_Report
(Opcional)

Especifica si se creará un resumen gráfico del resultado como un archivo .html.

  • NO_REPORTNo se crea un resumen gráfico. Esta es la opción predeterminada.
  • GENERATE_REPORTSe creará un resumen gráfico.
Boolean
Conceptualization_of_Spatial_Relationships

Especifica cómo se definirán las relaciones espaciales entre las entidades.

  • INVERSE_DISTANCELas entidades vecinas tienen mayor influencia sobre los cálculos de una entidad de destino que las entidades que están alejadas.
  • INVERSE_DISTANCE_SQUAREDEs lo mismo que la opción INVERSE_DISTANCE, salvo en que la pendiente es más nítida, de modo que la influencia cae de una forma más rápida y solo los vecinos más cercanos de la entidad de destino ejercerán una influencia sustancial en los cálculos de dicha entidad.
  • FIXED_DISTANCE_BANDCada entidad se analiza dentro del contexto de las entidades vecinas. Las entidades vecinas que se encuentran dentro de la distancia crítica especificada (valor de Distance_Band_or_Threshold) reciben un peso de 1 e influyen en los cálculos de la entidad de destino. Las entidades vecinas fuera de la distancia crítica reciben un peso de cero y no tienen influencia sobre los cálculos de una entidad de destino.
  • ZONE_OF_INDIFFERENCELas entidades que se encuentran dentro de la distancia crítica especificada (valor de Distance_Band_or_Threshold) de una entidad de destino reciben un peso de 1 e influyen en los cálculos de esa entidad. Una vez que se excede la distancia crítica, los pesos (y la influencia que una entidad vecina tiene sobre los cálculos de una entidad de destino) disminuyen con la distancia.
  • K_NEAREST_NEIGHBORSLas entidades k más cercanas se incluyen en el análisis. El parámetro number_of_neighbors especifica la cantidad de vecinos (k) que se desea incluir en el análisis.
  • CONTIGUITY_EDGES_ONLYSolo las entidades de polígono vecinas que comparten un límite o que se superponen tendrán influencia sobre los cálculos de la entidad poligonal de destino.
  • CONTIGUITY_EDGES_CORNERSLas entidades poligonales que comparten un límite, comparten un nodo o se superponen tendrán influencia sobre los cálculos de la entidad poligonal de destino.
  • GET_SPATIAL_WEIGHTS_FROM_FILELas relaciones espaciales vienen definidas por un archivo especificado de ponderaciones espaciales. La ruta al archivo de ponderaciones espaciales se especifica mediante el parámetro Weights_Matrix_File.
String
Distance_Method

Especifica cómo se calcularán las distancias desde cada entidad hasta las entidades vecinas.

  • EUCLIDEAN_DISTANCESe utilizará la distancia en línea recta entre dos puntos (como a vuelo de pájaro). Esta es la opción predeterminada.
  • MANHATTAN_DISTANCESe utilizará la distancia entre dos puntos medida a lo largo de los ejes en ángulos rectos (manzana). Esto se calculada sumando la diferencia (absoluta) entre las coordenadas x e y.
String
Standardization

Especifica que se aplicará la estandarización de ponderaciones espaciales. Se recomienda la estandarización de filas siempre que la distribución de entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto.

  • NONENo se aplica ninguna estandarización de ponderaciones espaciales.
  • ROWLas ponderaciones espaciales se estandarizarán; cada peso se dividirá por la suma de su fila (la suma de los pesos de todas las entidades vecinas). Esta es la opción predeterminada.
String
Distance_Band_or_Threshold_Distance
(Opcional)

Distancia de valor límite correspondiente a las diversas opciones de distancia inversa y distancia fija. Las entidades que están fuera del valor límite especificado para una entidad de destino se ignoran en el análisis de esa entidad. Sin embargo, para la ZONE_OF_INDIFFERENCE, la influencia de las entidades que están fuera de la distancia dada se reduce con la distancia, mientras que aquellas que están dentro del umbral de distancia se consideran por igual. El valor de distancia proporcionado debe coincidir con el del sistema de coordenadas de salida.

En las conceptualizaciones de relaciones espaciales de la distancia inversa, un valor de 0 indica que no se aplica una distancia de umbral; cuando este parámetro se deja en blanco, se calcula y se aplica un valor de umbral predeterminado. El valor predeterminado es la distancia euclidiana, lo que garantiza que cada entidad tenga como mínimo un vecino.

Este parámetro no tiene efecto cuando se especifica la conceptualización espacial de contigüidad de polígono (CONTIGUITY_EDGES_ONLY o CONTIGUITY_EDGES_CORNERS) o bien GET_SPATIAL_WEIGHTS_FROM_FILE.

Double
Weights_Matrix_File
(Opcional)

La ruta a un archivo que contenga los pesos que definen las relaciones espaciales, y potencialmente temporales entre las entidades.

File
number_of_neighbors
(Opcional)

Un número entero que especifica el número de vecinos que se incluirán en el análisis.

Long

Salida derivada

NombreExplicaciónTipo de datos
Index

El valor de índice de Moran.

Double
ZScore

La puntuación z.

Double
PValue

El valor p.

Double
Report_File

Un archivo HTML con resumen gráfico de los resultados.

File
Derived_Input_Dataset

Entidades de entrada de la herramienta.

Feature Layer

Muestra de código

Ejemplo 1 de SpatialAutocorrelation (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función SpatialAutocorrelation.

import arcpy
arcpy.env.workspace = r"c:\data"
arcpy.stats.SpatialAutocorrelation("olsResults.shp", "Residual", "NO_REPORT", 
                                   "GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN DISTANCE", 
                                   "NONE", "#", "euclidean6Neighs.swm")
Ejemplo 2 de SpatialAutocorrelation (script independiente)

El siguiente script independiente de Python muestra cómo utilizar la función SpatialAutocorrelation.

# Analyze the growth of regional per capita incomes in U.S.
# Counties from 1969 -- 2002 using Ordinary Least Squares Regression

# Import system modules
import arcpy

# Set property to overwrite existing outputs
arcpy.env.overwriteOutput = True

# Local variables...
workspace = r"C:\Data"

try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace

    # Growth as a function of {log of starting income, dummy for South
    # counties, interaction term for South counties, population density}
    # Process: Ordinary Least Squares... 
    ols = arcpy.stats.OrdinaryLeastSquares("USCounties.shp", "MYID", 
                        "olsResults.shp", "GROWTH",
                        "LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69",
                        "olsCoefTab.dbf",
                        "olsDiagTab.dbf")

    # Create Spatial Weights Matrix (can be based on input or output FC)
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.stats.GenerateSpatialWeightsMatrix("USCounties.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6) 
                        

    # Calculate Moran's I Index of Spatial Autocorrelation for 
    # OLS Residuals using a SWM File.  
    # Process: Spatial Autocorrelation (Morans I)...      
    moransI = arcpy.stats.SpatialAutocorrelation("olsResults.shp", "Residual",
                        "NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE", 
                        "EUCLIDEAN_DISTANCE", "NONE", "#", 
                        "euclidean6Neighs.swm")

except:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

Entornos

Casos especiales

Sistema de coordenadas de salida

La geometría de entidades se proyecta al Sistema de coordenadas de salida antes del análisis. Todos los cálculos matemáticos se basan en la referencia espacial del Sistema de coordenadas de salida. Cuando el entorno del Sistema de coordenadas de salida se basa en grados, minutos y segundos, las distancias geodésicas se calculan mediante distancias de cuerda.

Información de licenciamiento

  • Basic: Sí
  • Standard: Sí
  • Advanced: Sí

Temas relacionados