Relaciones bivariantes locales (Estadística espacial)

Resumen

Analiza las relaciones estadísticamente significativas de dos variables con entropía local. Cada entidad se clasifica en una de seis categorías en función del tipo de relación. La salida se puede utilizar para visualizar áreas con variables relacionadas y para explorar los cambios de su relación en el área de estudio.

Más información sobre cómo funciona Relaciones bivariantes locales

Ilustración

Ilustración de la herramienta Relaciones bivariantes locales
Detectar y visualizar la relación local entre dos variables.

Uso

  • Esta herramienta acepta puntos y polígonos como entrada y se deben utilizar con variables continuas. No es adecuada para datos binarios o de categorías.

  • Le recomendamos que almacene las entidades de salida en una geodatabase en lugar de como un shapefile (.shp). Los shapefiles no pueden almacenar valores nulos en atributos ni tampoco pueden almacenar gráficos en sus cuadros de diálogo emergentes.

  • Cada entidad de entrada se clasificará en una de las siguientes categorías de relaciones en función de la fiabilidad con la que el parámetro Variable explicativa pueda predecir el valor del parámetro Variable dependiente:

    • No significativa: la relación entre las variables no es significativa estadísticamente.
    • Lineal positiva: la variable dependiente aumenta linealmente a medida que aumenta la variable explicativa.
    • Lineal negativa: la variable dependiente disminuye linealmente a medida que aumenta la variable explicativa.
    • Cóncava: la variable dependiente cambia en forma de curva cóncava a medida que aumenta la variable explicativa.
    • Convexa: la variable dependiente cambia en forma de curva convexa a medida que aumenta la variable explicativa.
    • Complejo sin definir: las variables están relacionadas significativamente, pero ninguna otra categoría describe de forma fiable el tipo de relación.

  • Que exista una relación entre dos variables no depende de cuál esté etiquetada como variable explicativa y cuál como variable dependiente. Por ejemplo, si la diabetes se relaciona con la obesidad, la obesidad se relaciona de igual manera con la diabetes. Sin embargo, la clasificación del tipo de relación puede cambiar en función de qué variable está etiquetada como variable explicativa y cuál como variable dependiente. Una variable puede predecir con precisión una segunda variable, pero es posible que la segunda variable no prediga con precisión la primera. Si tiene dudas sobre qué variable debería etiquetar como explicativa y cuál debería ser dependiente, ejecute la herramienta dos veces para probar ambas opciones.

  • Esta herramienta admite el procesamiento en paralelo y utiliza el 50 por ciento de los procesadores disponibles de forma predeterminada. El número de procesadores puede aumentar o disminuir usando el entorno Factor de procesamiento en paralelo.

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades de entrada

La clase de entidad que contiene campos que representan los valores de Variable dependiente y Variable explicativa.

Feature Layer
Variable dependiente

El campo numérico que representa los valores de la variable dependiente. Al categorizar las relaciones, el valor de Variable explicativa se utiliza para predecir el valor de Variable dependiente.

Field
Variable explicativa

El campo numérico que representa los valores de la variable explicativa. Al categorizar las relaciones, el valor de Variable explicativa se utiliza para predecir el valor de Variable dependiente.

Field
Entidades de salida

La clase de entidad de salida que contiene todas las entidades de entrada con campos que representan el valor de Variable dependiente, el valor de Variable explicativa, puntuación de entropía, pseudo valor P, nivel de significado, tipo de relación categorizada y diagnósticos relacionados con la categorización.

Feature Class
Cantidad de vecinos
(Opcional)

El número de vecinos alrededor de cada entidad (incluida la entidad) que se utilizará para probar una relación local entre las variables. El número de vecinos debe ser entre 30 y 1.000; el valor predeterminado es 30. El valor proporcionado debe ser lo suficientemente alto como para detectar la relación entre entidades, pero lo suficientemente bajo como para seguir identificando patrones locales.

Long
Número de permutaciones
(Opcional)

Especifica el número de permutaciones que se utilizarán para calcular el pseudo valor P de cada entidad. Elegir el número de permutaciones es un equilibrio entre la precisión del pseudo valor P y un mayor tiempo de procesamiento.

  • 99 permutacionesCon 99 permutaciones, el pseudo valor P más pequeño posible es 0,01 y los demás pseudo valores P serán múltiplos de este valor.
  • 199 permutacionesCon 199 permutaciones, el pseudo valor P más pequeño posible es 0,005 y los demás pseudo valores P serán múltiplos de este valor. Esta es la opción predeterminada.
  • 499 permutacionesCon 499 permutaciones, el pseudo valor P más pequeño posible es 0,002 y los demás pseudo valores P serán múltiplos de este valor.
  • 999 permutacionesCon 999 permutaciones, el pseudo valor P más pequeño posible es 0,001 y los demás pseudo valores P serán múltiplos de este valor.
Long
Habilitar gráficos de dispersión emergentes locales
(Opcional)

Especifica si los gráficos de dispersión emergentes se generarán para cada entidad de salida. Cada gráfico de dispersión muestra los valores de las variables explicativa (eje horizontal) y dependiente (eje vertical) del vecindario local junto con una línea o curva ajustada que muestre la forma de la relación. Los gráficos de dispersión no son compatibles con las salidas de los shapefiles.

  • Activado: los gráficos de dispersión emergentes locales se generarán para cada entidad del dataset. Esta es la opción predeterminada.
  • Desactivado: los gráficos de dispersión emergentes no se generarán.
Boolean
Nivel de confianza
(Opcional)

Especifica el nivel de confianza de una prueba de hipótesis para relaciones significativas.

  • 90%El nivel de confianza es el 90 por ciento. Esta es la opción predeterminada.
  • 95%El nivel de confianza es el 95 por ciento.
  • 99%El nivel de confianza es el 99 por ciento.
String
Aplicar corrección False Discovery Rate (FDR)
(Opcional)

Especifica si la corrección False Discovery Rate (FDR) se aplicará a pseudo valores P.

  • Activado: la importancia estadística se basará en la corrección del FDR. Esta es la opción predeterminada.
  • Desactivado: la importancia estadística se basará en el pseudo valor P.
Boolean
Factor de escala (alfa)
(Opcional)

El nivel de sensibilidad a relaciones sutiles entre las variables. Los valores más altos (más cerca de 1) pueden detectar relaciones relativamente débiles, mientras que los valores más bajos (cerca de 0) solo detectarán relaciones sólidas. Los valores más bajos también son más sólidos para los valores atípicos. El valor debe estar entre 0,01 y 1; el valor predeterminado es 0,5.

Double

arcpy.stats.LocalBivariateRelationships(in_features, dependent_variable, explanatory_variable, output_features, {number_of_neighbors}, {number_of_permutations}, {enable_local_scatterplot_popups}, {level_of_confidence}, {apply_false_discovery_rate_fdr_correction}, {scaling_factor})
NombreExplicaciónTipo de datos
in_features

La clase de entidad que contiene campos que representan los valores de dependent_variable y explanatory_variable.

Feature Layer
dependent_variable

El campo numérico que representa los valores de la variable dependiente. Al categorizar las relaciones, el valor de explanatory_variable se utiliza para predecir el valor de dependent_variable.

Field
explanatory_variable

El campo numérico que representa los valores de la variable explicativa. Al categorizar las relaciones, el valor de explanatory_variable se utiliza para predecir el valor de dependent_variable.

Field
output_features

La clase de entidad de salida que contiene todas las entidades de entrada con campos que representan el valor de dependent_variable, el valor de explanatory_variable, puntuación de entropía, pseudo valor P, nivel de significado, tipo de relación categorizada y diagnósticos relacionados con la categorización.

Feature Class
number_of_neighbors
(Opcional)

El número de vecinos alrededor de cada entidad (incluida la entidad) que se utilizará para probar una relación local entre las variables. El número de vecinos debe ser entre 30 y 1.000; el valor predeterminado es 30. El valor proporcionado debe ser lo suficientemente alto como para detectar la relación entre entidades, pero lo suficientemente bajo como para seguir identificando patrones locales.

Long
number_of_permutations
(Opcional)

Especifica el número de permutaciones que se utilizarán para calcular el pseudo valor P de cada entidad. Elegir el número de permutaciones es un equilibrio entre la precisión del pseudo valor P y un mayor tiempo de procesamiento.

  • 99Con 99 permutaciones, el pseudo valor P más pequeño posible es 0,01 y los demás pseudo valores P serán múltiplos de este valor.
  • 199Con 199 permutaciones, el pseudo valor P más pequeño posible es 0,005 y los demás pseudo valores P serán múltiplos de este valor. Esta es la opción predeterminada.
  • 499Con 499 permutaciones, el pseudo valor P más pequeño posible es 0,002 y los demás pseudo valores P serán múltiplos de este valor.
  • 999Con 999 permutaciones, el pseudo valor P más pequeño posible es 0,001 y los demás pseudo valores P serán múltiplos de este valor.
Long
enable_local_scatterplot_popups
(Opcional)

Especifica si los gráficos de dispersión emergentes se generarán para cada entidad de salida. Cada gráfico de dispersión muestra los valores de las variables explicativa (eje horizontal) y dependiente (eje vertical) del vecindario local junto con una línea o curva ajustada que muestre la forma de la relación. Los gráficos de dispersión no son compatibles con las salidas de los shapefiles.

  • CREATE_POPUPLos gráficos de dispersión emergentes locales se generarán para cada entidad del dataset. Esta es la opción predeterminada.
  • NO_POPUPLos gráficos de dispersión emergentes no se generarán.
Boolean
level_of_confidence
(Opcional)

Especifica el nivel de confianza de una prueba de hipótesis para relaciones significativas.

  • 90%El nivel de confianza es el 90 por ciento. Esta es la opción predeterminada.
  • 95%El nivel de confianza es el 95 por ciento.
  • 99%El nivel de confianza es el 99 por ciento.
String
apply_false_discovery_rate_fdr_correction
(Opcional)

Especifica si la corrección False Discovery Rate (FDR) se aplicará a pseudo valores P.

  • APPLY_FDRLa importancia estadística se basará en la corrección del FDR. Esta es la opción predeterminada.
  • NO_FDRLa importancia estadística se basará en el pseudo valor P.
Boolean
scaling_factor
(Opcional)

El nivel de sensibilidad a relaciones sutiles entre las variables. Los valores más altos (más cerca de 1) pueden detectar relaciones relativamente débiles, mientras que los valores más bajos (cerca de 0) solo detectarán relaciones sólidas. Los valores más bajos también son más sólidos para los valores atípicos. El valor debe estar entre 0,01 y 1; el valor predeterminado es 0,5.

Double

Muestra de código

Ejemplo 1 de LocalBivariateRelationships (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función LocalBivariateRelationships.

import arcpy
arcpy.env.workspace = 'C:\\LBR\\MyData.gdb'
arcpy.stats.LocalBivariateRelationships('ObesityDiabetes', 'ObesityRate', 
                   'DiabetesRate','LBR_Results', 30, '199', 'CREATE_POPUP', 
                   '95%', 'APPLY_FDR', 0.5)
Ejemplo 2 de LocalBivariateRelationships (script independiente)

El siguiente script independiente de Python muestra cómo utilizar la función LocalBivariateRelationships.

# Use the Local Bivariate Relationships tool to study the relationship between
# obesity and diabetes.

# Import system modules.
import arcpy
import os

# Set property to overwrite existing output by default.
arcpy.env.overwriteOutput = True

try:
    # Set the workspace and input features.
    arcpy.env.workspace = r"C:\\LBR\\MyData.gdb"
    inputFeatures = 'ObesityDiabetes'

    # Set the output workspace and output name.
    outws = 'C:\\LBR\\outputs.gdb'
    outputName = 'LBR_Results'

    # Set input features, dependent variable, and explanatory variable.
    depVar = 'DiabetesRate'
    explVar = 'ObesityRate'

    # Set number of neighbors and permutations.
    numNeighbors = 50
    numPerms = '999'

    # Choose to create pop-ups.
    popUps = 'CREATE_POPUP'

    # Choose confidence level and apply False Discovery Rate correction.
    confLevel = '95%'
    fdr = 'APPLY_FDR'

    # Set the scaling factor.
    scaleFactor = 0.5

    # Run Local Bivariate Relationships.
    arcpy.stats.LocalBivariateRelationships(inputFeatures, depVar, explVar, 
                                            os.path.join(outws, outputName), 
                                            numNeighbors, numPerms, popUps, 
                                            confLevel, fdr, scaleFactor)

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

Información de licenciamiento

  • Basic: Sí
  • Standard: Sí
  • Advanced: Sí

Temas relacionados