Resumen
Mide la autocorrelación espacial en función de las ubicaciones de entidades y los valores de atributo mediante la estadística I de Moran global.
Más información sobre cómo funciona Autocorrelación espacial (I de Moran global)
Ilustración
Uso
La herramienta Autocorrelación espacial devuelve cinco valores: el índice I de Moran, el índice esperado, la varianza, la puntuación z y el valor P. Estos valores se escriben como mensajes en la parte inferior del panel Geoprocesamiento durante la ejecución de la herramienta y se transmiten como valores de salida derivados para su uso potencial en modelos o scripts. Para acceder a los mensajes, pase el cursor sobre la barra de progreso y haga clic en el botón emergente o expanda la sección de detalles de los mensajes del panel Geoprocesamiento. También puede acceder a los mensajes y detalles de una herramienta ejecutada anteriormente a través del historial de geoprocesamiento. Opcionalmente, puede crear un informe HTML con un resumen gráfico de los resultados mediante el uso de esta herramienta. La ruta al informe se incluirá con los mensajes que resumen los parámetros de ejecución de la herramienta. Haga clic en esa ruta para abrir el archivo de informe.
Dado un conjunto de entidades y un atributo asociado, esta herramienta evalúa si el patrón expresado está agrupado, disperso o es aleatorio. Cuando la puntuación z o el valor p indican una significancia estadística, un valor positivo del índice I de Moran indica una tendencia hacia el clustering mientras que un valor negativo del índice I de Moran indica una tendencia hacia la dispersión.
- Esta herramienta calcula una puntuación z y un valor p que le indican si puede rechazar las hipótesis nulas. En este caso, la hipótesis nula establece que los valores de las entidades no están espacialmente correlacionados.
- Los resultados de la puntuación z y el valor p son medidas de significancia estadística que indican si se debe rechazar o no la hipótesis nula. Para esta herramienta, la hipótesis nula establece que los valores asociados con entidades están distribuidos en forma aleatoria.
El Campo de entrada debe contener una variedad de valores. La operación matemática para esta estadística requiere cierta variación en la variable analizada; no puede resolver si todos los valores de entrada son 1, por ejemplo. Si desea utilizar esta herramienta para analizar el patrón espacial de los datos de incidentes, considere agregar los datos de incidentes. El Análisis de puntos calientes optimizado también se puede utilizar para analizar el patrón espacial de datos de incidentes.
Nota:
Los datos de incidentes son puntos que representan eventos (delincuencia, accidentes de tráfico) u objetos (árboles, tiendas) donde el foco se centra en su presencia o ausencia en lugar de algún atributo de medición asociado con cada punto.
Cuando la Clase de entidad de entrada no está proyectada (es decir, cuando las coordenadas se especifican en grados, minutos y segundos) o cuando el sistema de coordenadas de salida está establecido en un Sistema de coordenadas geográficas, las distancias se calculan mediante mediciones de cuerda. Las mediciones de distancia de cuerda se utilizan porque se pueden calcular rápidamente y proporcionar muy buenas estimaciones de verdaderas distancias geodésicas, al menos para los puntos separados unos treinta grados entre sí. Las distancias de cuerda se basan en un esferoide oblato. Dados dos puntos en la superficie de la Tierra, la distancia de cuerda entre ellos es la longitud de una línea, que atraviesa la Tierra tridimensional, para conectar estos dos puntos. Las distancias de cuerda se informan en metros.
Precaución:
Asegúrese de proyectar los datos si su área de estudio se extiende más allá de los 30 grados. Las distancias de cuerda no son una buena estimación de las distancias geodésicas más allá de 30 grados.
Cuando se utilizan distancias de cuerda en el análisis, el parámetro Banda de distancia o distancia de umbral, si se especifica, debe proporcionarse en metros.
Los centroides de entidad se utilizan en los cálculos de distancia para las entidades de línea y polígono. Para multipuntos, polilíneas o polígonos con varias partes, el centroide se calcula utilizando el centro medio ponderado de todas las partes de entidad. La ponderación para las entidades de punto es 1, para las entidades de línea es longitud y para las entidades de polígono es área.
El parámetro Conceptualización de relaciones espaciales deberá reflejar relaciones inherentes entre las entidades que analiza. Cuanto más pueda modelar de manera realista cómo interactúan mutuamente las entidades en el espacio, más precisos serán sus resultados. Las recomendaciones se describen en Seleccionar una conceptualización de relaciones espaciales: mejores prácticas. Aquí le presentamos algunas sugerencias adicionales:
- Banda de distancia fija
El parámetro Banda de distancia o Distancia de umbral predeterminado garantizará que cada entidad tenga al menos un vecino. Es importante, pero en muchos casos este valor predeterminado no es la distancia más apropiada para el análisis. En Banda de distancia (esfera de influencia) se describen estrategias adicionales para seleccionar una escala apropiada (banda de distancia) para su análisis.
- Distancia inversa o Distancia inversa cuadrada
Cuando se introduce cero como valor del parámetro Banda de distancia o distancia de umbral, se considera que todas las entidades son vecinas de las demás entidades; cuando este parámetro se deja en blanco, se aplica la distancia predeterminada.
Los pesos de las distancias menores que 1 se vuelven inestables cuando se invierten. Por consiguiente, a los pesos de entidades separadas por menos de 1 unidad de distancia se les da un peso de 1.
Para las opciones de distancia inversa (Distancia inversa, Distancia inversa cuadrada y Zona de indiferencia), se asignará un peso de 1 a todos los pares de puntos coincidentes para evitar la división por cero. Esto garantiza que las entidades no sean excluidas del análisis.
- FIXED_DISTANCE_BAND
El parámetro Banda de distancia o Distancia de umbral predeterminado garantizará que cada entidad tenga al menos un vecino. Es importante, pero en muchos casos este valor predeterminado no es la distancia más apropiada para el análisis. En Banda de distancia o Distancia de umbral se describen estrategias adicionales para seleccionar una escala apropiada (banda de distancia) para su análisis.
- INVERSE_DISTANCE o INVERSE_DISTANCE_SQUARED
Cuando se introduce cero como valor del parámetro Banda de distancia o distancia de umbral, se considera que todas las entidades son vecinas de las demás entidades; cuando este parámetro se deja en blanco, se aplica la distancia predeterminada.
Los pesos de las distancias menores que 1 se vuelven inestables cuando se invierten. Por consiguiente, a los pesos de entidades separadas por menos de 1 unidad de distancia se les da un peso de 1.
Para las opciones de distancia inversa (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED y ZONE_OF_INDIFFERENCE), se asignará un peso de 1 a todos los pares de puntos coincidentes para evitar la división por cero. Esto garantiza que las entidades no sean excluidas del análisis.
- Banda de distancia fija
En Python, la salida derivada de esta herramienta contiene el valor de índice I de Moran, la puntuación z, el valor p y un archivo de informe HTML. Por ejemplo, si asigna el objeto Result de la herramienta a una variable denominada MoranResult, MoranResult[0] almacena el valor de índice I de Moran, MoranResult[1] almacena la puntuación z, MoranResult[2] almacena el valor p, y MoranResult[3] almacena la ruta del archivo de informe HTML. Si no genera un archivo de informe HTML mediante el uso del parámetro Generar informe, la ultima salida derivada será una cadena vacía.
Las opciones adicionales para el parámetro Conceptualización de relaciones espaciales, incluidas las relaciones tridimensionales y espaciotemporales, están disponibles mediante la herramienta Generar matriz de ponderaciones espaciales. Para aprovechar estas opciones adicionales, cree un archivo de matriz de ponderaciones espaciales antes del análisis; seleccione Obtener ponderaciones espaciales a partir del archivo para el parámetro Conceptualización de relaciones espaciales y, para el parámetro Archivo de matriz de ponderaciones, especifique la ruta del archivo de ponderaciones espaciales que creó.
Las capas del mapa se pueden utilizar para definir la Clase de entidad de entrada. Cuando se utiliza una capa con una selección, solo las entidades seleccionadas se incluyen en el análisis.
Si proporciona un Archivo de matriz de ponderaciones con una extensión .swm, esta herramienta espera un archivo de matriz de ponderaciones espaciales creado utilizando la herramienta Generar matriz de ponderaciones espaciales ; de lo contrario, esta herramienta espera un archivo de matriz de ponderaciones espaciales con formato ASCII. En algunos casos, el comportamiento es diferente según el tipo de archivo de matriz de ponderaciones espaciales que se utiliza:
- Archivos de matriz de ponderaciones espaciales con formato ASCII:
- Las ponderaciones se utilizan como están. Las relaciones de entidad a entidad que faltan se tratan como ceros.
- Si los pesos están estandarizados por fila, es probable que los resultados sean incorrectos para el análisis en los conjuntos de selección. Si necesita ejecutar el análisis en un conjunto de selección, convierta el archivo de ponderaciones espaciales ASCII en un archivo SWM leyendo los datos ASCII en una tabla y utilizando después la opción Convertir tabla con la herramienta Generar matriz de ponderaciones espaciales.
- Archivo de matriz de ponderaciones espaciales con formato SWM:
- Si los pesos están estandarizados en filas, se volverán a estandarizar para los conjuntos de selección; de lo contrario, los pesos se utilizan como están.
- Archivos de matriz de ponderaciones espaciales con formato ASCII:
La ejecución del análisis con un archivo de matriz de ponderaciones espaciales con formato ASCII consume muchos recursos de memoria. Para los análisis de más de 5.000 entidades, considere convertir el archivo de matriz de ponderaciones espaciales con formato ASCII en un archivo con formato SWM. Primero coloque los pesos ASCII en una tabla con formato (por ejemplo, por medio de Excel). A continuación, ejecute la herramienta Generar matriz de ponderaciones espaciales utilizando Convertir tabla para el parámetro Conceptualización de relaciones espaciales. El resultado será un archivo de matriz de ponderaciones espaciales con formato .SWM.
Para las entidades de polígono, casi siempre le convendrá elegir Fila para el parámetro Estandarización. La estandarización de filas reduce el sesgo cuando la cantidad de vecinos que posee cada entidad es una función del esquema de agregación o proceso de muestreo, en lugar de reflejar la distribución espacial real de la variable que está analizando.
El tema de ayuda Modelado de relaciones espaciales ofrece información adicional sobre los parámetros de esta herramienta.
Nota:
Es posible que la memoria sea insuficiente cuando ejecuta esta herramienta. Generalmente, esto ocurre cuando se selecciona Conceptualización de relaciones espaciales y Banda de distancia o Distancia de umbral, lo que genera entidades con un gran número de vecinos. Generalmente, no desea definir relaciones espaciales para que las entidades tengan miles de vecinos. Desea que todas las entidades tengan como mínimo un vecino y que casi todas las entidades tengan como mínimo ocho vecinos.
Precaución:
Al utilizar shapefiles tenga en cuenta que no pueden almacenar valores nulos. Las herramientas u otros procedimientos que crean shapefiles a partir de entradas sin shapefiles pueden almacenar o interpretar valores nulos como cero. En algunos casos, los nulos se almacenan como valores negativos muy grandes en shapefiles. Esto puede ocasionar resultados inesperados. Consulte Consideraciones de geoprocesamiento para la salida del shapefile para obtener más información.
Sintaxis
arcpy.stats.SpatialAutocorrelation(Input_Feature_Class, Input_Field, {Generate_Report}, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Weights_Matrix_File}, {number_of_neighbors})
Parámetro | Explicación | Tipo de datos |
Input_Feature_Class | La clase de entidad para la que se calculará la autocorrelación espacial. | Feature Layer |
Input_Field | El campo numérico utilizado en la evaluación de la autocorrelación espacial. | Field |
Generate_Report (Opcional) |
| Boolean |
Conceptualization_of_Spatial_Relationships | Especifica cómo se definen las relaciones espaciales entre las entidades.
| String |
Distance_Method | Especifica cómo se calculan las distancias desde cada entidad hasta las entidades vecinas.
| String |
Standardization | Especifica que se aplicará la estandarización de ponderaciones espaciales. Se recomienda la estandarización de filas siempre que la distribución de las entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto.
| String |
Distance_Band_or_Threshold_Distance (Opcional) | Distancia de valor límite correspondiente a las diversas opciones de distancia inversa y distancia fija. Las entidades que están fuera del valor límite especificado para una entidad de destino se ignoran en el análisis de esa entidad. Sin embargo, para la ZONE_OF_INDIFFERENCE, la influencia de las entidades que están fuera de la distancia dada se reduce con la distancia, mientras que aquellas que están dentro del umbral de distancia se consideran por igual. El valor de distancia introducido debe coincidir con el del sistema de coordenadas de salida. En las conceptualizaciones de relaciones espaciales de la distancia inversa, un valor de 0 indica que no se aplica una distancia de umbral; cuando este parámetro se deja en blanco, se calcula y se aplica un valor de umbral predeterminado. Este valor predeterminado es la distancia euclidiana, lo que garantiza que cada entidad tenga como mínimo un vecino. Este parámetro no tiene efecto cuando se selecciona la conceptualización espacial de contigüidad de polígono (CONTIGUITY_EDGES_ONLY o CONTIGUITY_EDGES_CORNERS) o bien GET_SPATIAL_WEIGHTS_FROM_FILE. | Double |
Weights_Matrix_File (Opcional) | La ruta a un archivo que contenga los pesos que definen las relaciones espaciales, y potencialmente temporales entre las entidades. | File |
number_of_neighbors (Opcional) | Un número entero que especifica el número de vecinos que se desea incluir en el análisis. | Long |
Salida derivada
Nombre | Explicación | Tipo de datos |
Index | El valor de índice de Moran. | Doble |
ZScore | La puntuación z. | Doble |
PValue | El valor p. | Doble |
Report_File | Un archivo HTML con resumen gráfico de los resultados. | Archivo |
Muestra de código
El siguiente script de la ventana de Python muestra cómo utilizar la herramienta SpatialAutocorrelation.
import arcpy
arcpy.env.workspace = r"c:\data"
arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual","NO_REPORT",
"GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN DISTANCE",
"NONE", "#","euclidean6Neighs.swm")
El siguiente script de Phython independiente muestra cómo utilizar la herramienta SpatialAutocorrelation.
# Analyze the growth of regional per capita incomes in US
# Counties from 1969 -- 2002 using Ordinary Least Squares Regression
# Import system modules
import arcpy
# Set property to overwrite existing outputs
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\Data"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Growth as a function of {log of starting income, dummy for South
# counties, interaction term for South counties, population density}
# Process: Ordinary Least Squares...
ols = arcpy.OrdinaryLeastSquares_stats("USCounties.shp", "MYID",
"olsResults.shp", "GROWTH",
"LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69",
"olsCoefTab.dbf",
"olsDiagTab.dbf")
# Create Spatial Weights Matrix (Can be based off input or output FC)
# Process: Generate Spatial Weights Matrix...
swm = arcpy.GenerateSpatialWeightsMatrix_stats("USCounties.shp", "MYID",
"euclidean6Neighs.swm",
"K_NEAREST_NEIGHBORS",
"#", "#", "#", 6)
# Calculate Moran's I Index of Spatial Autocorrelation for
# OLS Residuals using a SWM File.
# Process: Spatial Autocorrelation (Morans I)...
moransI = arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual",
"NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE",
"EUCLIDEAN_DISTANCE", "NONE", "#",
"euclidean6Neighs.swm")
except:
# If an error occurred when running the tool, print out the error message.
print(arcpy.GetMessages())
Entornos
- Sistema de coordenadas de salida
La geometría de entidades se proyecta al Sistema de coordenadas de salida antes del análisis. Todos los cálculos matemáticos se basan en la referencia espacial del Sistema de coordenadas de salida. Cuando el entorno del Sistema de coordenadas de salida se basa en grados, minutos y segundos, las distancias geodésicas se calculan mediante distancias de cuerda.
Información de licenciamiento
- Basic: Sí
- Standard: Sí
- Advanced: Sí
Temas relacionados
- Vista general del conjunto de herramientas Análisis de patrones
- Modelado de relaciones espaciales
- ¿Qué es una puntuación z? ¿Qué es un valor P?
- Buscar una herramienta de geoprocesamiento
- Promedio de vecinos más cercanos
- Análisis de clúster y de valor atípico (I Anselin local de Moran)
- Análisis de puntos calientes (Gi* de Getis-Ord)
- Ponderaciones espaciales
- Cómo funciona Autocorrelación espacial (I de Moran global)