Crear variables explicativas de componentes espaciales (Estadística espacial)

Resumen

Crea un conjunto de campos de componentes espaciales que describen mejor los patrones espaciales de uno o más campos numéricos y sirven como variables explicativas útiles en un modelo de predicción o regresión.

Los campos de entrada deben ser las variables explicativas y dependientes que se utilizarán en un modelo de predicción. Los campos de componentes espaciales resultantes (denominados vectores propios de Moran) pueden utilizarse como variables explicativas (además de las variables explicativas originales) que a menudo mejorarán el poder predictivo del modelo al tener en cuenta los patrones espaciales de las demás variables.

Más información sobre los vectores propios de Moran

Ilustración

Ilustración de la herramienta Crear variables explicativas de componentes espaciales

Uso

  • La herramienta crea componentes espaciales que pueden predecir con mayor exactitud los valores de los campos de entrada. Cada componente representa un patrón espacial, y los componentes seleccionados serán aquellos cuyos patrones se parezcan más a los patrones de los campos de entrada. Por ejemplo, si un campo tiene una amplia tendencia de oeste a este, pero también contiene pequeños grupos de valores bajos y altos, el patrón podría representarse combinando dos componentes: uno que represente la tendencia de oeste a este y otro que represente los grupos. Al incluir variables explicativas que se asemejan a los patrones espaciales de las variables explicativas y dependientes, los efectos espaciales se tienen en cuenta en herramientas de predicción y regresión como Regresión lineal generalizada y Clasificación y regresión basadas en bosques y potenciadas. Al tener en cuenta los efectos espaciales, estos modelos de predicción no espacial suelen predecir con mayor exactitud, y el sesgo espacial (como los patrones espaciales en los residuos) suele reducirse. Esto es importante para que el modelo no infravalore o sobrevalore sistemáticamente determinadas zonas. Además, los coeficientes de las variables explicativas pueden interpretarse más fácilmente porque estimarán la relación directa entre la variable explicativa y la variable dependiente, filtrando al mismo tiempo el ruido introducido por los efectos espaciales.

  • Esta herramienta está pensada para crear variables explicativas que puedan utilizarse en modelos de predicción; no obstante, la herramienta Filtrar la autocorrelación espacial del campo también puede utilizarse con este fin eliminando la autocorrelación espacial del campo residual o residual normalizado de un modelo de predicción. Los componentes espaciales que filtran eficazmente la autocorrelación residual suelen ser variables explicativas útiles y a menudo pueden proporcionar una mejora del modelo equivalente a esta herramienta utilizando menos componentes como variables explicativas. Se recomienda probar ambas herramientas y comparar los resultados de incluir los componentes espaciales de cada una en el modelo de predicción original (por ejemplo, comparando los valores R cuadrado ajustado o AIC).

  • Los componentes espaciales se devolverán como campos en la clase de entidad de salida y, cuando la herramienta se ejecute en un mapa activo, la capa de entidad de salida se dibujará basándose en el primer componente espacial. Los campos de entrada también se incluirán en la clase de entidad de salida, de modo que las variables explicativas originales y las variables explicativas de componentes espaciales puedan utilizarse para predecir la variable dependiente en herramientas de predicción sin necesidad de fusionar las clases de entidad de entrada y salida.

  • Los mensajes de geoprocesamiento incluyen las dos tablas siguientes que resumen la selección de componentes espaciales utilizados para filtrar espacialmente el campo de entrada:

    • Historial de búsqueda de vecindades: para cada una de las 28 matrices de ponderación espacial (SWM) que se probaron, se muestran los detalles de la SWM (como el número de vecinos y el esquema de ponderación), el valor p y el valor R cuadrado ajustado al utilizar todos los componentes, el valor R cuadrado ajustado al utilizar solo los componentes seleccionados y el número de componentes que se seleccionaron. La SWM con el valor R cuadrado ajustado más alto utilizando los componentes seleccionados se utilizará para crear los componentes y se indicará con texto en negrita y un asterisco.
    • Historial de búsqueda de componentes espaciales: para la SWM seleccionado, se muestra el valor Id. de cada componente (por ejemplo, Id. 4 significa que era el cuarto componente espacial), el valor I de Moran y el valor p del componente, y el valor R cuadrado ajustado del componente (incluidos todos los componentes seleccionados anteriormente). Las filas están ordenadas por los componentes que individualmente predijeron los campos de entrada con mayor eficacia (valor R cuadrado más alto).

  • La herramienta selecciona una SWM para las entidades de entrada (a menos que se proporcione una en el parámetro Archivo de matriz de ponderaciones espaciales de entrada) y selecciona las variables explicativas de los componentes mediante el siguiente procedimiento:

    1. Para cada una de las 28 SWM candidatas, se comprueba la significación estadística de la SWM mediante la predicción de los campos de entrada utilizando todos los componentes espaciales como variables explicativas. La prueba de importancia utiliza el valor R cuadrado combinado de todos los campos de entrada y realiza una corrección Šidák del valor p para tener en cuenta el número de SWM analizadas. Cualquier SWM que no sea estadísticamente significativa será eliminada de la lista de candidatos.
    2. Para cada una de las SWM candidatas restantes, se agregan secuencialmente componentes espaciales como variables explicativas hasta que el siguiente componente no sea estadísticamente significativo por sí solo (el valor p sea superior a 0,05) o el valor R cuadrado ajustado del componente (y de todos los componentes seleccionados previamente) supere el valor R cuadrado ajustado al utilizar todos los componentes de la SWM. Cada nuevo componente se selecciona buscando el que tenga la mayor significación estadística (valor p más bajo) cuando se utiliza para predecir los campos de entrada.
    3. El archivo SWM con el mayor valor R cuadrado ajustado resultante se selecciona como SWM final, y el conjunto asociado de componentes espaciales seleccionados se devuelve como campos en la clase de entidades de salida.

    Este procedimiento se denomina método de selección FWD (Forward), descrito detalladamente en la siguiente referencia:

    • Blanchet, F. Guillaume, Pierre Legendre y Daniel Borcard. 2008. "Forward selection of explanatory variables." Ecology 89, no. 9: 2623-2632. https://doi.org/10.1890/07-0986.1.

    .

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades de entrada

Entidades de entrada que contienen campos de las variables explicativas y dependientes que se utilizarán en un modelo de predicción.

Feature Layer
Campos de entrada

Campos de entrada de las variables explicativas y dependientes que se utilizarán en un modelo de predicción.

Field
Entidades de salida

Entidades de salida que contendrán campos de los componentes espaciales que se pueden utilizar como variables explicativas adicionales en un modelo de predicción.

Feature Class
Incorporar todos los campos de las entidades de entrada
(Opcional)

Especifica si todos los campos se copiarán de las entidades de entrada a la clase de entidades de salida.

  • Activado: todos los campos de las entidades de entrada se copiarán en la clase de entidades de salida. Esta es la opción predeterminada.
  • Desactivado: en la clase de entidades de salida solo se copiarán los campos de entrada.
Boolean
Archivo de matriz de ponderaciones espaciales de entrada
(Opcional)

Archivo SWM de entrada (.swm). Si se proporciona un valor, el archivo se utilizará para definir vecinos y pesos de las entidades de entrada. Si no se proporciona ningún valor, la herramienta probará 28 vecindarios diferentes y utilizará el que cree componentes más eficaces como variables explicativas.

File
Archivo de matriz de ponderaciones espaciales de salida
(Opcional)

Archivo SWM de salida (.swm) de los vecinos y las ponderaciones seleccionados por la herramienta. Este parámetro no se aplica si se proporciona un archivo .swm de entrada.

File
Campo de Id. único
(Opcional)

Campo de Id. único del archivo .swm de salida. El campo debe ser un número entero y debe tener un valor único para cada entidad de entrada.

Field

arcpy.stats.CreateSpatialComponentExplanatoryVariables(in_features, input_fields, out_features, {append_all_fields}, {in_swm}, {out_swm}, {id_field})
NombreExplicaciónTipo de datos
in_features

Entidades de entrada que contienen campos de las variables explicativas y dependientes que se utilizarán en un modelo de predicción.

Feature Layer
input_fields
[input_fields,...]

Campos de entrada de las variables explicativas y dependientes que se utilizarán en un modelo de predicción.

Field
out_features

Entidades de salida que contendrán campos de los componentes espaciales que se pueden utilizar como variables explicativas adicionales en un modelo de predicción.

Feature Class
append_all_fields
(Opcional)

Especifica si todos los campos se copiarán de las entidades de entrada a la clase de entidades de salida.

  • ALLTodos los campos de las entidades de entrada se copiarán en la clase de entidades de salida. Esta es la opción predeterminada.
  • NO_FIELDSEn la clase de entidades de salida solo se copiarán los campos de entrada.
Boolean
in_swm
(Opcional)

Archivo SWM de entrada (.swm). Si se proporciona un valor, el archivo se utilizará para definir vecinos y pesos de las entidades de entrada. Si no se proporciona ningún valor, la herramienta probará 28 vecindarios diferentes y utilizará el que cree componentes más eficaces como variables explicativas.

File
out_swm
(Opcional)

Archivo SWM de salida (.swm) de los vecinos y las ponderaciones seleccionados por la herramienta. Este parámetro no se aplica si se proporciona un archivo .swm de entrada.

File
id_field
(Opcional)

Campo de Id. único del archivo .swm de salida. El campo debe ser un número entero y debe tener un valor único para cada entidad de entrada.

Field

Muestra de código

Ejemplo 1 de CreateSpatialComponentExplanatoryVariables (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función CreateSpatialComponentExplanatoryVariables.

# Create fields that describe the spatial patterns of POPULATION.

arcpy.env.workspace = r"c:\data\project_data.gdb"

arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="states",
    input_fields="POPULATION",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)
Ejemplo 2 de CreateSpatialComponentExplanatoryVariables (script indiependiente)

El siguiente script independiente muestra cómo utilizar la función CreateSpatialComponentExplanatoryVariables.

# Create fields that describe the spatial patterns of two analysis fields.

import arcpy

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"

# Run the tool.
arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="myFeatureClass",
    input_fields="myAnalysisField1;myAnalysis Field2",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

# Print the messages. 
print(arcpy.GetMessages())

Información de licenciamiento

  • Basic: Sí
  • Standard: Sí
  • Advanced: Sí

Temas relacionados