Crear variables explicativas de componentes espaciales (Estadística espacial)—ArcGIS Pro

Resumen

Crea un conjunto de campos de componentes espaciales que describen mejor los patrones espaciales de uno o varios campos numéricos y sirven como variables explicativas útiles en un modelo de predicción o regresión.

Los campos de entrada deben ser las variables explicativas y dependientes que se utilizarán en un modelo de predicción. Los campos de componentes espaciales resultantes (llamados eigenvectores de Moran) pueden utilizarse como variables explicativas (además de las variables explicativas originales) que mejorarán con frecuencia el poder de predicción del modelo al tener en cuenta los patrones espaciales de las demás variables.

Más información sobre los eigenvectores de Moran

Ilustración

Uso

La herramienta crea componentes espaciales que pueden predecir con mayor precisión los valores de los campos de entrada. Cada componente representa un patrón espacial y los componentes seleccionados serán aquellos cuyos patrones se parezcan más a los patrones de los campos de entrada. Por ejemplo, si un campo tiene una amplia tendencia oeste-este pero también contiene pequeños clústeres de valores bajos y altos, el patrón podría representarse combinando dos componentes: uno que represente la tendencia oeste-este y otro que represente los clústeres. Al incluir variables explicativas que se asemejan a los patrones espaciales de las variables explicativas y dependientes, los efectos espaciales se tienen en cuenta en herramientas de predicción y regresión como Regresión lineal generalizada y Clasificación y regresión basadas en bosques y aumentadas. Al tener en cuenta los efectos espaciales, estos modelos de predicción no espaciales suelen predecir con mayor precisión y, con frecuencia, se reduce el sesgo espacial (como los patrones espaciales en los residuales). Es importante para que determinadas áreas no queden sistemáticamente infravaloradas o sobrevaloradas por el modelo. Además, los coeficientes de las variables explicativas pueden interpretarse más fácilmente porque estimarán la relación directa entre la variable explicativa y la variable dependiente, filtrando al mismo tiempo el ruido introducido por los efectos espaciales.
Esta herramienta está pensada para crear variables explicativas que puedan utilizarse en modelos de predicción; sin embargo, la herramienta Filtrar autocorrelación espacial de campo también puede utilizarse con este fin eliminando la autocorrelación espacial del campo residual o residual estandarizado de un modelo de predicción. Los componentes espaciales que filtran eficazmente la autocorrelación residual son con frecuencia variables explicativas útiles y pueden proporcionar con frecuencia una mejora del modelo equivalente a esta herramienta utilizando menos componentes como variables explicativas. Se recomienda probar ambas herramientas y comparar los resultados de incluir los componentes espaciales de cada una en el modelo de predicción original (por ejemplo, comparando los valores R cuadrado ajustado o AIC).
Los componentes espaciales se devolverán como campos de la clase de entidad de salida, y cuando la herramienta se ejecute en un mapa activo, la capa de entidades de salida se dibujará basándose en el primer componente espacial. Los campos de entrada también se incluirán en la clase de entidad de salida para que las variables explicativas originales y las variables explicativas de componente espacial puedan utilizarse para predecir la variable dependiente en las herramientas de predicción sin necesidad de fusionar las clases de entidad de entrada y de salida.
Los mensajes de geoprocesamiento incluyen las tablas siguientes que resumen la selección de componentes espaciales utilizados para filtrar espacialmente el campo de entrada:
- Historial de búsqueda de vecindad: para cada una de las matrices de ponderaciones espaciales (SWM) que se probaron, se muestran los detalles de la SWM (como el número de vecinos y el esquema de ponderación), el valor p y el valor R cuadrado ajustado cuando se utilizan todos los componentes, el valor R cuadrado ajustado cuando se utilizan solo los componentes seleccionados y el número de componentes que se seleccionaron. La SWM con el valor R cuadrado ajustado más alto utilizando los componentes seleccionados se utilizará para crear los componentes y se indicará con texto en negrita y un asterisco.
- Historial de búsqueda de componentes espaciales: para la SWM seleccionada, se muestra el valor de Id. de cada componente (por ejemplo, Id. 4 significa que era el cuarto componente espacial), el valor I de Moran y el valor p del componente, y el valor R cuadrado ajustado del componente (incluidos todos los componentes seleccionados anteriormente). Las filas están ordenadas por los componentes que individualmente predijeron los campos de entrada con mayor eficacia (valor R cuadrado más alto).
Para seleccionar la SWM que se utilizará para crear los componentes espaciales, la herramienta genera una lista de SWM candidatas y comprueba cuál crea componentes espaciales que predicen con mayor precisión los valores de los campos de entrada. Si no se proporcionan archivos de SWM en el parámetro Archivos de matriz de ponderaciones espaciales de entrada, se crearán 28 SWM y se incluirán en la lista de candidatas (consulte Comprensión de los autovectores de Moran para ver las descripciones de cada SWM). Si se proporcionan SWM de entrada, puede utilizar el parámetro Comparar solo matrices de ponderaciones espaciales de entrada para especificar si la lista de candidatas solo incluye las SWM proporcionadas o bien incluye las SWM proporcionadas y las 28 SWM creadas por la herramienta. Por ejemplo, para utilizar una única SWM especificada, proporcione la SWM en el parámetro Archivos de matriz de ponderaciones espaciales de entrada y deje marcado el parámetro Comparar solo matrices de ponderaciones espaciales de entrada.
La herramienta selecciona entre las SWM candidatas utilizando el siguiente procedimiento:
1. Para cada una de las 28 SWM candidatas, se comprueba la significación estadística de la SWM mediante la predicción de los campos de entrada utilizando todos los componentes espaciales como variables explicativas. La prueba de significación utiliza el R cuadrado combinado de todos los campos de entrada y realiza una corrección Šidák del valor p para tener en cuenta el número de SWM analizadas. Cualquier SWM que no sea estadísticamente significativa será eliminada de la lista de candidatos.
2. Para cada SWM candidata restante, se agregan secuencialmente componentes espaciales como variables explicativas hasta que el siguiente componente no sea estadísticamente significativo por sí solo (el valor p sea superior a 0,05) o el valor R cuadrado ajustado del componente (y de todos los componentes seleccionados previamente) supere el valor R cuadrado ajustado al utilizar todos los componentes de la SWM. Cada nuevo componente se selecciona buscando el que tenga la mayor significación estadística (valor p más bajo) cuando se utiliza para predecir los campos de entrada.
3. La SWM con el mayor valor R cuadrado ajustado resultante se selecciona como SWM final, y el conjunto asociado de componentes espaciales seleccionados se devuelve como campos en la clase de entidades de salida.
Este procedimiento se denomina método de selección FWD (Forward) y se describe detalladamente en la siguiente referencia:
- Blanchet, F. Guillaume, Pierre Legendre y Daniel Borcard. 2008. "Forward selection of explanatory variables." Ecology 89, núm. 9: 2623-2632. https://doi.org/10.1890/07-0986.1.
.

Parámetros

Etiqueta	Explicación	Tipo de datos
Entidades de entrada	Las entidades de entrada que contienen campos de las variables explicativas y dependientes que se utilizarán en un modelo de predicción.	Feature Layer
Campos de entrada	Los campos de entrada de las variables explicativas y dependientes que se utilizarán en un modelo de predicción.	Field
Entidades de salida	Las entidades de salida que contendrán campos de los componentes espaciales que pueden utilizarse como variables explicativas adicionales en un modelo de predicción.	Feature Class
Incorporar todos los campos de las entidades de entrada (Opcional)	Especifica si todos los campos se copiarán de las entidades de entrada a la clase de entidad de salida. Activado: todos los campos de las entidades de entrada se copiarán en la clase de entidad de salida. Esta es la opción predeterminada. Desactivado: solo los campos de entrada se copiarán en la clase de entidad de salida.	Boolean
Archivos de matriz de ponderaciones espaciales de entrada (Opcional)	Una lista de archivos SWM de entrada (.swm) que se utilizarán como candidatas para la SWM que se utilizará para crear las variables explicativas del componente espacial. Si no se proporcionan archivos, la herramienta probará 28 vecindarios diferentes.	File
Archivo de matriz de ponderaciones espaciales de salida (Opcional)	El archivo SWM (.swm) de salida de los vecinos y pesos seleccionados por la herramienta. Este parámetro no se aplica si proporciona un archivo .swm de entrada.	File
Campo de Id. único (Opcional)	El campo de Id. único del archivo .swm de salida. El campo debe ser un entero y debe tener un valor único para cada entidad de entrada.	Field
Comparar solo matrices de ponderaciones espaciales de entrada (Opcional)	Especifica si solo se probarán los archivos .swm proporcionados en el parámetro Archivos de matriz de ponderaciones espaciales de entrada o si también se probarán 28 vecindarios adicionales. La herramienta usará la SWM que crea componentes espaciales que predicen con mayor precisión los valores de los campos de entrada. Este parámetro solo se aplica si se proporciona al menos una SWM de entrada. Marcado: solo se probarán las SWM de entrada proporcionadas en el parámetro Archivos de matriz de ponderaciones espaciales de entrada. Esta es la opción predeterminada. Sin marcar: se probarán las SWM entrada proporcionadas en el parámetro Archivos de matriz de ponderaciones espaciales de entrada y otros 28 vecindarios.	Boolean

arcpy.stats.CreateSpatialComponentExplanatoryVariables(in_features, input_fields, out_features, {append_all_fields}, {in_swm}, {out_swm}, {id_field}, {compare_only_inputs})

Nombre	Explicación	Tipo de datos
in_features	Las entidades de entrada que contienen campos de las variables explicativas y dependientes que se utilizarán en un modelo de predicción.	Feature Layer
input_fields [input_fields,...]	Los campos de entrada de las variables explicativas y dependientes que se utilizarán en un modelo de predicción.	Field
out_features	Las entidades de salida que contendrán campos de los componentes espaciales que pueden utilizarse como variables explicativas adicionales en un modelo de predicción.	Feature Class
append_all_fields (Opcional)	Especifica si todos los campos se copiarán de las entidades de entrada a la clase de entidad de salida. ALL—Todos los campos de las entidades de entrada se copiarán en la clase de entidad de salida. Esta es la opción predeterminada. NO_FIELDS—Solo los campos de entrada se copiarán en la clase de entidad de salida.	Boolean
in_swm [in_swm,...] (Opcional)	Una lista de archivos SWM de entrada (.swm) que se utilizarán como candidatas para la SWM que se utilizará para crear las variables explicativas del componente espacial. Si no se proporcionan archivos, la herramienta probará 28 vecindarios diferentes.	File
out_swm (Opcional)	El archivo SWM (.swm) de salida de los vecinos y pesos seleccionados por la herramienta. Este parámetro no se aplica si proporciona un archivo .swm de entrada.	File
id_field (Opcional)	El campo de Id. único del archivo .swm de salida. El campo debe ser un entero y debe tener un valor único para cada entidad de entrada.	Field
compare_only_inputs (Opcional)	Especifica si solo se probarán los archivos .swm proporcionados en el parámetro in_swm o si también se probarán 28 vecindarios adicionales. La herramienta usará la SWM que crea componentes espaciales que predicen con mayor precisión los valores de los campos de entrada. Este parámetro solo se aplica si se proporciona al menos una SWM de entrada. COMPARE_INPUTS—Solo se probarán los archivos de entrada .swm proporcionados en el parámetro in_swm. Esta es la opción predeterminada. COMPARE_ALL—Se probarán los archivos de entrada .swm proporcionados en el parámetro in_swm y otros 28 vecindarios.	Boolean

Muestra de código

Ejemplo 1 de CreateSpatialComponentExplanatoryVariables (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función CreateSpatialComponentExplanatoryVariables.

# Create fields that describe the spatial patterns of POPULATION.

arcpy.env.workspace = r"c:\data\project_data.gdb"

arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="states",
    input_fields="POPULATION",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

Ejemplo 2 de CreateSpatialComponentExplanatoryVariables (script independiente)

El siguiente script independiente muestra cómo utilizar la función CreateSpatialComponentExplanatoryVariables.

# Create fields that describe the spatial patterns of two analysis fields.

import arcpy

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"

# Run the tool.
arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="myFeatureClass",
    input_fields="myAnalysisField1;myAnalysis Field2",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

# Print the messages. 
print(arcpy.GetMessages())

Entornos

Transformaciones geográficas, Sistema de coordenadas de salida, Factor de procesamiento en paralelo, Generador de números aleatorios

Información de licenciamiento

Basic: Sí
Standard: Sí
Advanced: Sí

Temas relacionados

¿Algún comentario sobre este tema?