Relaciones bivariantes locales (Estadística espacial)

Resumen

Analiza las relaciones estadísticamente significativas de dos variables con entropía local. Cada entidad se clasifica en una de seis categorías en función del tipo de relación. La salida se puede utilizar para visualizar áreas con variables relacionadas y para explorar los cambios de su relación en el área de estudio.

Más información sobre cómo funciona Relaciones bivariantes locales

Ilustración

Relaciones locales entre dos variables
Detecte y visualice la relación local entre dos variables.

Uso

  • Esta herramienta acepta puntos y polígonos como entrada y se deben utilizar con variables continuas. No es adecuada para datos binarios o de categorías.

  • Le recomendamos que almacene sus Entidades de salida en una geodatabase en lugar de como un shapefile (.shp). Los shapefiles no pueden almacenar valores nulos en atributos ni tampoco pueden almacenar gráficos en sus cuadros de diálogo emergentes.

  • Cada entidad de entrada se clasificará en una de las siguientes categorías de relaciones en función de la fiabilidad con la que el parámetro Variable explicativa pueda predecir el parámetro Variable dependiente:

    • No significativa: la relación entre las variables no es significativa estadísticamente.
    • Lineal positiva: la variable dependiente aumenta linealmente a medida que aumenta la variable explicativa.
    • Lineal negativa: la variable dependiente disminuye linealmente a medida que aumenta la variable explicativa.
    • Cóncava: la variable dependiente cambia en forma de curva cóncava a medida que aumenta la variable explicativa.
    • Convexa: la variable dependiente cambia en forma de curva convexa a medida que aumenta la variable explicativa.
    • Complejo sin definir: las variables mantienen están relacionadas significativamente, pero ninguna de las otras categorías describe de forma fiable el tipo de relación.

  • Que exista o no una relación entre dos variables no depende de cuál esté etiquetada como variable explicativa y cuál como variable dependiente. Por ejemplo, si la diabetes está relacionada con la obesidad, la obesidad se relaciona de igual manera con la diabetes. Sin embargo, la clasificación del tipo de relación puede cambiar en función de qué variable está etiquetada como variable explicativa y cuál como variable dependiente. Es posible que una variable prediga con precisión una segunda variable, pero la segunda variable no puede predecir con precisión la primera. Si tiene dudas sobre qué variable debería etiquetar como explicativa y como dependiente, ejecute la herramienta dos veces para probar ambas opciones.

  • Esta herramienta admite el procesamiento en paralelo y utiliza el 50 por ciento de los procesadores disponibles de forma predeterminada. El número de procesadores puede aumentar o disminuir usando el entorno Factor de procesamiento en paralelo.

Sintaxis

arcpy.stats.LocalBivariateRelationships(in_features, dependent_variable, explanatory_variable, output_features, {number_of_neighbors}, {number_of_permutations}, {enable_local_scatterplot_popups}, {level_of_confidence}, {apply_false_discovery_rate_fdr_correction}, {scaling_factor})
ParámetroExplicaciónTipo de datos
in_features

La clase de entidad que contiene campos que representan la dependent_variable y la explanatory_variable.

Feature Layer
dependent_variable

El campo numérico que representa los valores de la variable dependiente. Al categorizas las relaciones, la explanatory_variable se utiliza para predecir la dependent_variable.

Field
explanatory_variable

El campo numérico que representa los valores de la variable explicativa. Al categorizas las relaciones, la explanatory_variable se utiliza para predecir la dependent_variable.

Field
output_features

La clase de entidad de salida que contiene todas las entidades de entrada con campos que representan la dependent_variable, explanatory_variable, puntuación de entropía, pseudo valor P, nivel de significado, tipo de relación categorizada y diagnósticos relacionados con la categorización.

Feature Class
number_of_neighbors
(Opcional)

El número de vecinos alrededor de cada entidad (incluida la entidad) que se utilizará para probar una relación local entre las variables. El número de vecinos debe ser entre 30 y 1000; el valor predeterminado es 30. El valor proporcionado debe ser lo suficientemente alto como para detectar la relación entre entidades, pero lo suficientemente bajo como para seguir identificando patrones locales.

Long
number_of_permutations
(Opcional)

Especifica el número de permutaciones utilizadas para calcular el pseudo valor P de cada entidad. Elegir el número de permutaciones es un equilibrio entre la precisión del pseudo valor P y un mayor tiempo de procesamiento.

  • 99Con 99 permutaciones, el pseudo valor P más pequeño posible es 0,01 y los demás pseudo valores P serán múltiplos de este valor.
  • 199Con 199 permutaciones, el pseudo valor P más pequeño posible es 0,005 y los demás pseudo valores P serán múltiplos de este valor. Esta es la configuración predeterminada
  • 499Con 499 permutaciones, el pseudo valor P más pequeño posible es 0,002 y los demás pseudo valores P serán múltiplos de este valor.
  • 999Con 999 permutaciones, el pseudo valor P más pequeño posible es 0,001 y los demás pseudo valores P serán múltiplos de este valor.
Long
enable_local_scatterplot_popups
(Opcional)

Especifica si los gráficos de dispersión emergentes se generarán para cada entidad de salida. Cada gráfico de dispersión muestra los valores de las variables explicativa (eje horizontal) y dependiente (eje vertical) del vecindario local junto con una línea o curva ajustada que muestre la forma de la relación. Los gráficos de dispersión no son compatibles con las salidas de los shapefiles.

  • CREATE_POPUPLos gráficos de dispersión emergentes locales se generarán para cada entidad del dataset. Esta es la opción predeterminada.
  • NO_POPUPLos gráficos de dispersión emergentes no se generarán.
Boolean
level_of_confidence
(Opcional)

Especifica el nivel de confianza de una prueba de hipótesis para relaciones significativas.

  • 90%90 % de nivel de confianza. Esta es la opción predeterminada.
  • 95%95 % de nivel de confianza.
  • 99%99 % de nivel de confianza.
String
apply_false_discovery_rate_fdr_correction
(Opcional)

Especifica si la corrección False Discovery Rate (FDR) se aplicará a pseudo valores P.

  • APPLY_FDRLa importancia estadística se basará en la corrección del FDR. Esta es la opción predeterminada.
  • NO_FDRLa importancia estadística se basará en el pseudo valor P.
Boolean
scaling_factor
(Opcional)

Controla la sensibilidad a relaciones sutiles entre las variables. Los valores más altos (más cerca de 1) pueden detectar relaciones relativamente débiles, mientras que los valores más bajos (cerca de 0) solo detectarán relaciones sólidas. Los valores más bajos también son más sólidos para los valores atípicos. El valor debe estar entre 0,01 y 1; el valor predeterminado es 0,5.

Double

Muestra de código

Ejemplo 1 de LocalBivariateRelationships (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función LocalBivariateRelationships.

import arcpy
arcpy.env.workspace = 'C:\\LBR\\MyData.gdb'
arcpy.LocalBivariateRelationships_stats('ObesityDiabetes', 'ObesityRate', 
                   'DiabetesRate','LBR_Results', 30, '199', 'CREATE_POPUP', 
                   '95%', 'APPLY_FDR', 0.5)
Ejemplo 2 de LocalBivariateRelationships (script independiente)

El siguiente script independiente de Python muestra cómo utilizar la función LocalBivariateRelationships.

# Use the Local Bivariate Relationships tool to study the relationship between
# obesity and diabetes.
# Import system modules.
import arcpy
import os
# Set property to overwrite existing output by default.
arcpy.env.overwriteOutput = True
try:
    # Set the workspace and input features.
    arcpy.env.workspace = r"C:\\LBR\\MyData.gdb"
    inputFeatures = 'ObesityDiabetes'
    # Set the output workspace and output name.
    outws = 'C:\\LBR\\outputs.gdb'
    outputName = 'LBR_Results'
    # Set input features, dependent variable, and explanatory variable.
    depVar = 'DiabetesRate'
    explVar = 'ObesityRate'
    # Set number of neighbors and permutations.
    numNeighbors = 50
    numPerms = '999'
    # Choose to create popups.
    popUps = 'CREATE_POPUP'
    # Choose confidence level and apply False Discovery Rate correction.
    confLevel = '95%'
    fdr = 'APPLY_FDR'
    # Set the scaling factor.
    scaleFactor = 0.5
    # Run Local Bivariate Regression.
    arcpy.LocalBivariateRelationships_stats(inputFeatures, depVar, explVar, 
                                            os.path.join(outws, outputName), 
                                            numNeighbors, numPerms, popUps, 
                                            confLevel, fdr, scaleFactor)
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Información de licenciamiento

  • Basic: Sí
  • Standard: Sí
  • Advanced: Sí

Temas relacionados