Asociación espacial bivariante (L de Lee) (Estadística espacial)

Resumen

Calcula la asociación espacial entre dos variables continuas mediante el valor estadístico L de Lee.

El valor estadístico L de Lee caracteriza tanto el grado de correlación como el grado de copatterning (similitud de agrupación espacial) entre las variables. El valor estará comprendido entre -1 y 1 y es conceptualmente similar a un coeficiente de correlación, pero se ajusta para tener en cuenta la autocorrelación espacial de las dos variables. Los valores L de Lee cercanos a 1 indican que las variables están muy correlacionadas positivamente y que cada variable tiene una alta autocorrelación espacial (los valores altos y bajos de las variables tienden a agruparse). Los valores próximos a -1 indican que las variables están muy correlacionadas negativamente y que cada variable tiene una autocorrelación espacial muy positiva. Los valores próximos a 0 indican que las variables no están correlacionadas, no están autocorrelacionadas espacialmente o ambas cosas.

El valor estadístico L de Lee puede dividirse para cada entidad de entrada, denominadas valores estadísticos L de Lee locales, que muestran la asociación espacial local de la entidad y sus vecinos. Esto puede utilizarse para determinar las zonas que tienen una asociación espacial mayor o menor que el valor estadístico L de Lee global. Los valores estadísticos locales también pueden clasificarse en una de las distintas categorías en función de los valores de los vecinos de cada entidad. Se comprueba la significación estadística de los valores estadísticos globales y locales mediante permutaciones.

Más información sobre cómo funciona la herramienta Asociación espacial bivariante (L de Lee)

Ilustración

Ilustración de la herramienta Asociación espacial bivariante (L de Lee)
Las dos variables de la fila superior tienen una asociación espacial positiva, y las dos variables de la fila inferior tienen una asociación espacial negativa.

Uso

  • Las dos variables de análisis deben ser continuas (no binarias ni categóricas), y las variables deben tener una relación lineal. Si la relación no es lineal, utilice la herramienta Transformar campo para aplicar transformaciones a las variables de análisis para linealizar la relación y vuelva a ejecutar la herramienta con los valores transformados.

  • La herramienta devuelve una serie de resultados que permiten investigar la asociación espacial entre las dos variables de análisis. Los mensajes de geoprocesamiento muestran el valor estadístico L de Lee y el valor p, y la clase de entidad de salida contiene campos que resumen los valores estadísticos L de Lee locales, los valores p y los resultados de significación estadística. Cuando se ejecuta en un mapa activo, la capa de entidades de salida dibujará basándose en las categorías de asociación espacial local: Not Significant, High-High, Low-Low, High-Low y Low-High. Por ejemplo, si el valor estadístico local L de Lee es al menos estadísticamente significativo en un 90 %, la primera variable de análisis es superior al valor medio y la segunda variable es inferior al valor medio, la categoría será High-Low.

    Más información sobre los resultados de la herramienta

  • Los valores p para comprobar la significación estadística de las asociaciones espaciales globales y locales se calculan mediante permutaciones.

  • Utilice al menos 50 entidades de entrada e incluya al menos 8 vecinos para cada entidad.

  • Los vecindarios de cada entidad siempre incluyen la entidad. Si se utiliza un archivo de ponderaciones espaciales para definir vecinos, se definirá una ponderación de 1 para la ponderación de una entidad consigo misma, aun cuando el archivo de ponderaciones espaciales no tenga definida la ponderación. Las ponderaciones de cada vecindario se estandarizan por filas para que sumen 1.

  • El entorno Generador de números aleatorios se puede utilizar para reproducir las permutaciones y los valores p. Si no se especifica ningún valor de inicialización, los valores p globales y locales pueden cambiar debido al azar. Sin embargo, si el entorno Factor de procesamiento paralelo se establece en un valor superior a 1 (el valor predeterminado), las permutaciones no serán coherentes, incluso con un valor de inicialización fijo del generador de números aleatorios.

  • La inversión del orden de las dos variables de análisis no cambiará los valores estadísticos L de Lee globales o locales, pero los valores p pueden cambiar debido a la aleatoriedad de las permutaciones. Las categorías High-Low y Low-High también se invertirán.

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades de entrada

Entidades de entrada que contienen los campos de las dos variables de análisis.

Feature Layer
Campo de análisis 1

Campo de la primera variable de análisis. El campo debe ser numérico.

Field
Campo de análisis 2

Campo de la segunda variable de análisis. El campo debe ser numérico.

Field
Entidades de salida

Entidades de salida que contienen los valores estadísticos L de Lee locales, las categorías de asociación espacial, los valores p y las medias ponderadas de los vecinos de cada entidad.

Feature Class
Tipo de vecindad
(Opcional)

Especifica cómo se determinarán los vecinos de cada entidad. La entidad siempre se incluye en la vecindad, y todas las ponderaciones de la vecindad se normalizan para que sumen 1.

  • Banda de distancia fijaLas entidades dentro de una distancia crítica especificada de cada entidad se incluirán como vecinas. Esta es la opción predeterminada para las entidades de punto.
  • K vecinos más próximosLas entidades K más cercanas se incluirán como vecinas.
  • Solo bordes de contigüidadLas entidades de polígono que compartan algún borde se incluirán como vecinas.
  • Bordes o esquinas de contigüidadLas entidades de polígono que compartan algún eje o esquina se incluirán como vecinas. Esta es la opción predeterminada para las entidades poligonales.
  • Triangulación de DelaunayLos puntos cuya triangulación de Delaunay (polígonos de Thiessen) compartan un eje o esquina se incluirán como vecinos.
  • Obtener ponderaciones espaciales a partir del archivoLos vecinos y las ponderaciones se definirán mediante un archivo de ponderaciones espaciales.
String
Banda de distancia
(Opcional)

Banda de distancia que se utilizará para determinar los vecinos alrededor de la entidad focal. Si no se especifica ningún valor, la distancia será la más corta que permita que cada entidad tenga al menos un vecino en su vecindad. En el caso de los polígonos, se utilizará la distancia entre centroides para determinar los vecinos.

Linear Unit
Cantidad de vecinos
(Opcional)

Número de vecinos alrededor de cada entidad que se incluirá como vecinos. El valor no incluye la entidad. Por ejemplo, si se especifica 6, se utilizará la entidad y sus seis vecinas más cercanas (siete entidades en total). El valor predeterminado es 8. El valor debe ser al menos 2.

Long
Archivo de matriz de ponderaciones
(Opcional)

Ruta y nombre del archivo de la matriz de ponderaciones espaciales que define los vecinos y las ponderaciones entre las entidades.

File
Esquema de ponderación local
(Opcional)

Especifica el esquema de ponderación que se aplicará a los vecinos al calcular las asociaciones espaciales.

  • No ponderadoLos vecinos no serán ponderados. Esta es la opción predeterminada.
  • BicuadradoLos vecinos se ponderarán utilizando un kernel bicuadrado (cuártico).
String
Ancho de banda kernel
(Opcional)

Ancho de banda para el núcleo bicuadrado. El ancho de banda define la rapidez con la que las ponderaciones disminuyen con la distancia. Los anchos de banda mayores proporcionarán ponderaciones comparativamente mayores a los vecinos más alejados de la entidad. Para el vecindario de k vecinos más cercanos, el valor predeterminado (vacío) utilizará un ancho de banda adaptativo igual a la distancia al vecino (k+1)º de la entidad focal. En el caso del vecindario de banda de distancia fija, el valor predeterminado (vacío) utilizará el mismo valor que la banda de distancia.

Linear Unit
Número de permutaciones
(Opcional)

Especifica el número de permutaciones que se utilizarán para crear distribuciones de referencia al calcular los valores p globales y locales. Todos los valores p se calculan mediante pruebas de hipótesis bilaterales.

  • 99El análisis utilizará 99 permutaciones. Con 99 permutaciones, el valor p más pequeño posible es 0,02 y los demás valores p serán múltiplos de este valor.
  • 199El análisis utilizará 199 permutaciones. Con 199 permutaciones, el valor p más pequeño posible es 0,01 y los demás valores p serán múltiplos de este valor.
  • 499El análisis utilizará 499 permutaciones. Con 499 permutaciones, el valor p más pequeño posible es 0,004 y los demás valores p serán múltiplos de este valor.
  • 999El análisis utilizará 999 permutaciones. Con 999 permutaciones, el valor p más pequeño posible es 0,002 y los demás valores p serán múltiplos de este valor. Esta opción se recomienda para las pruebas de confianza del 90 %. Esta es la opción predeterminada.
  • 4999El análisis utilizará 4999 permutaciones. Con 4999 permutaciones, el valor p más pequeño posible es 0,004 y los demás valores p serán múltiplos de este valor. Esta opción se recomienda para las pruebas de confianza del 95 %.
  • 9999El análisis utilizará 9999 permutaciones. Con 9999 permutaciones, el valor p más pequeño posible es 0,0002 y los demás valores p serán múltiplos de este valor. Esta opción se recomienda para las pruebas de confianza del 99 %.
Long

Salida derivada

EtiquetaExplicaciónTipo de datos
L de Lee

Valor estadístico L de Lee para las variables de análisis.

Double
Valor p

Valor p para el valor estadístico L de Lee.

Double
Correlación de Pearson

Correlación de Pearson entre las variables de análisis.

Double

arcpy.stats.BivariateSpatialAssociation(in_features, analysis_field1, analysis_field2, out_features, {neighborhood_type}, {distance_band}, {num_neighbors}, {weights_matrix_file}, {local_weighting_scheme}, {kernel_bandwidth}, {num_permutations})
NombreExplicaciónTipo de datos
in_features

Entidades de entrada que contienen los campos de las dos variables de análisis.

Feature Layer
analysis_field1

Campo de la primera variable de análisis. El campo debe ser numérico.

Field
analysis_field2

Campo de la segunda variable de análisis. El campo debe ser numérico.

Field
out_features

Entidades de salida que contienen los valores estadísticos L de Lee locales, las categorías de asociación espacial, los valores p y las medias ponderadas de los vecinos de cada entidad.

Feature Class
neighborhood_type
(Opcional)

Especifica cómo se determinarán los vecinos de cada entidad. La entidad siempre se incluye en la vecindad, y todas las ponderaciones de la vecindad se normalizan para que sumen 1.

  • DISTANCE_BANDLas entidades dentro de una distancia crítica especificada de cada entidad se incluirán como vecinas. Esta es la opción predeterminada para las entidades de punto.
  • K_NEAREST_NEIGHBORSLas entidades K más cercanas se incluirán como vecinas.
  • CONTIGUITY_EDGES_ONLYLas entidades de polígono que compartan algún borde se incluirán como vecinas.
  • CONTIGUITY_EDGES_CORNERSLas entidades de polígono que compartan algún eje o esquina se incluirán como vecinas. Esta es la opción predeterminada para las entidades poligonales.
  • DELAUNAY_TRIANGULATIONLos puntos cuya triangulación de Delaunay (polígonos de Thiessen) compartan un eje o esquina se incluirán como vecinos.
  • GET_SPATIAL_WEIGHTS_FROM_FILELos vecinos y las ponderaciones se definirán mediante un archivo de ponderaciones espaciales.
String
distance_band
(Opcional)

Banda de distancia que se utilizará para determinar los vecinos alrededor de la entidad focal. Si no se especifica ningún valor, la distancia será la más corta que permita que cada entidad tenga al menos un vecino en su vecindad. En el caso de los polígonos, se utilizará la distancia entre centroides para determinar los vecinos.

Linear Unit
num_neighbors
(Opcional)

Número de vecinos alrededor de cada entidad que se incluirá como vecinos. El valor no incluye la entidad. Por ejemplo, si se especifica 6, se utilizará la entidad y sus seis vecinas más cercanas (siete entidades en total). El valor predeterminado es 8. El valor debe ser al menos 2.

Long
weights_matrix_file
(Opcional)

Ruta y nombre del archivo de la matriz de ponderaciones espaciales que define los vecinos y las ponderaciones entre las entidades.

File
local_weighting_scheme
(Opcional)

Especifica el esquema de ponderación que se aplicará a los vecinos al calcular las asociaciones espaciales.

  • UNWEIGHTEDLos vecinos no serán ponderados. Esta es la opción predeterminada.
  • BISQUARELos vecinos se ponderarán utilizando un kernel bicuadrado (cuártico).
String
kernel_bandwidth
(Opcional)

Ancho de banda para el núcleo bicuadrado. El ancho de banda define la rapidez con la que las ponderaciones disminuyen con la distancia. Los anchos de banda mayores proporcionarán ponderaciones comparativamente mayores a los vecinos más alejados de la entidad. Para el vecindario de k vecinos más cercanos, el valor predeterminado (vacío) utilizará un ancho de banda adaptativo igual a la distancia al vecino (k+1)º de la entidad focal. En el caso del vecindario de banda de distancia fija, el valor predeterminado (vacío) utilizará el mismo valor que la banda de distancia.

Linear Unit
num_permutations
(Opcional)

Especifica el número de permutaciones que se utilizarán para crear distribuciones de referencia al calcular los valores p globales y locales. Todos los valores p se calculan mediante pruebas de hipótesis bilaterales.

  • 99El análisis utilizará 99 permutaciones. Con 99 permutaciones, el valor p más pequeño posible es 0,02 y los demás valores p serán múltiplos de este valor.
  • 199El análisis utilizará 199 permutaciones. Con 199 permutaciones, el valor p más pequeño posible es 0,01 y los demás valores p serán múltiplos de este valor.
  • 499El análisis utilizará 499 permutaciones. Con 499 permutaciones, el valor p más pequeño posible es 0,004 y los demás valores p serán múltiplos de este valor.
  • 999El análisis utilizará 999 permutaciones. Con 999 permutaciones, el valor p más pequeño posible es 0,002 y los demás valores p serán múltiplos de este valor. Esta opción se recomienda para las pruebas de confianza del 90 %. Esta es la opción predeterminada.
  • 4999El análisis utilizará 4999 permutaciones. Con 4999 permutaciones, el valor p más pequeño posible es 0,004 y los demás valores p serán múltiplos de este valor. Esta opción se recomienda para las pruebas de confianza del 95 %.
  • 9999El análisis utilizará 9999 permutaciones. Con 9999 permutaciones, el valor p más pequeño posible es 0,0002 y los demás valores p serán múltiplos de este valor. Esta opción se recomienda para las pruebas de confianza del 99 %.
Long

Salida derivada

NombreExplicaciónTipo de datos
lee_l

Valor estadístico L de Lee para las variables de análisis.

Double
p_value

Valor p para el valor estadístico L de Lee.

Double
corr

Correlación de Pearson entre las variables de análisis.

Double

Muestra de código

Ejemplo 1 de BivariateSpatialAssociation (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función BivariateSpatialAssociation.

# Calculate the Lee's L statistic using eight nearest neighbors
# and adaptive bandwidth.
arcpy.env.workspace = r"c:\data\project_data.gdb"
arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="K_NEAREST_NEIGHBORS",
    distance_band=None,
    num_neighbors=8,
    weights_matrix_file=None,
    local_weighting_scheme="BISQUARE",
    kernel_bandwidth=None,
    num_permutations=9999
)
Ejemplo 2 de BivariateSpatialAssociation (secuencia de comandos independiente)

El siguiente script independiente muestra cómo utilizar la función BivariateSpatialAssociation.

# Calculate the Lee's L statistic for two analysis fields.  

import arcpy 

# Set the current workspace
arcpy.env.workspace = r"c:\data\project_data.gdb" 

# Run tool

arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="CONTIGUITY_EDGES_CORNERS",
    distance_band=None,
    num_neighbors=None,
    weights_matrix_file=None,
    local_weighting_scheme="UNWEIGHTED",
    kernel_bandwidth=None,
    num_permutations=9999
)

# Print the messages. The messages include the Lee's L statistic, p-value, 
# Pearson correlations, and spatial smoothing scalars.

print(arcpy.GetMessages())

Información de licenciamiento

  • Basic: Sí
  • Standard: Sí
  • Advanced: Sí

Temas relacionados