Mínimos cuadrados ordinarios (OLS) (Estadística espacial)—ArcGIS Pro

Resumen

Realiza una regresión lineal global de Mínimos cuadrados ordinarios (OLS) para generar una predicción o modelar una variable dependiente en términos de sus relaciones con un conjunto de variables explicativas.

Nota:

La funcionalidad de esta herramienta se incluye en la herramienta Regresión lineal generalizada agregada a ArcGIS Pro 2.3. La herramienta Regresión lineal generalizada admite más modelos.

Más información sobre cómo funciona la regresión de Mínimos cuadrados ordinarios

Ilustración

Uso

La salida principal de esta herramienta es un archivo de informe que se escribe como mensajes en la parte inferior del panel Geoprocesamiento durante la ejecución de la herramienta. Puede acceder a los mensajes desplazándose sobre la barra de progreso, haciendo clic en el botón emergente o expandiendo la sección de mensajes en el panel Geoprocesamiento. También puede acceder a los mensajes de una ejecución anterior de Regresión exploratoria a través del historial de geoprocesamiento.
La herramienta OLS también produce una clase de entidad de salida y tablas opcionales con diagnósticos e información de coeficiente. Se puede acceder a todo esto desde los mensajes de la parte inferior del panel Geoprocesamiento. La clase de entidad de salida se agrega automáticamente a la Tabla de contenido con un esquema de representación cálido/frío que se aplica a los residuales del modelo. Se proporciona una explicación completa de cada salida en Cómo funciona la regresión de OLS.
Los resultados de la regresión OLS son confiables solo si los datos y el modelo de regresión satisfacen todas las presuposiciones que este método requiere inherentemente. Consulte la tabla Problemas, consecuencias y soluciones comunes de regresión en Conceptos básicos del análisis de regresión para asegurarse de que su modelo esté adecuadamente especificado.
Las variables dependientes y explicativas deben ser campos numéricos que contengan una variedad de valores. Los OLS no pueden generar resultados cuando las variables tienen el mismo valor (por ejemplo, todos los valores de un campo son 9,0). Los métodos de regresión lineal, como OLS, no son adecuados para predecir resultados binarios (por ejemplo, todos los valores de la variable dependiente son 1 o 0).
El campo Unique ID vincula las predicciones del modelo con cada entidad. Como consecuencia, los valores de Unique ID deben ser únicos para cada entidad y, por lo general, deben ser un campo permanente que se mantiene con la clase de entidad. Si no tiene ningún campo de Unique ID, puede crear uno agregando un nuevo campo de tipo entero a la tabla de clases de entidad y calculando los valores de campo para que sean iguales a los del campo FID/OID. No puede utilizar el campo FID/OID directamente para el parámetro Id. único.
Siempre que exista una autocorrelación espacial estadísticamente significativa de los residuales de regresión, se considerará que el modelo OLS no se ha especificado correctamente. Como consecuencia, los resultados de la regresión de OLS no son fiables. Asegúrese de ejecutar la herramienta Autocorrelación espacial en los residuales de la regresión para evaluar este problema potencial. La autocorrelación espacial estadísticamente significativa de los residuales de regresión casi siempre indica la ausencia de una o más variables explicativas clave en el modelo.
Inspeccione visualmente las sobrepredicciones y las subpredicciones que sean evidentes en los residuales de regresión para ver si ofrecen pistas sobre las posibles variables que falten en el modelo de regresión. Podría ayudarle a ejecutar el Análisis de punto caliente en los residuales para visualizar el clustering espacial de las sobrepredicciones y las subpredicciones.
Cuando se produce una especificación incorrecta como resultado del intento de modelar variables no estacionarias con un modelo global (OLS es un modelo global), se puede utilizar una Regresión ponderada geográficamente para mejorar las predicciones y comprender mejor la ausencia de estacionariedad (variación regional) inherente en las variables explicativas.
Cuando el resultado de un cálculo es infinito o indefinido, la salida para los no shapefiles será Nulo; para los shapefiles la salida será -DBL_MAX (-1,7976931348623158e+ 308, por ejemplo).
Los diagnósticos del resumen del modelo se escriben en el informe de resumen de OLS y la tabla de salida de diagnóstico opcional. Ambos incluyen diagnósticos para el Criterio de información de Akaike corregido (AICc), el Coeficiente de determinación, el índice estadístico F conjunto, el índice estadístico de Wald, el índice estadístico Breusch-Pagan de Koenker y el índice estadístico de Jarque-Bera. La tabla de diagnóstico también incluye valores AIC y Sigma cuadrado sin corregir.
Las tablas de salida de coeficiente y diagnóstico opcionales se sobrescribirán, si ya existen, cuando la opción Permitir que las herramientas de geoprocesamiento sobrescriban los datasets existentes esté activada.
En los equipos configurados con los paquetes de idiomas de ArcGIS para árabe y otros idiomas que se escriben de derecha a izquierda, es posible que observe que falta texto o que detecte problemas de formato en el PDF Archivo de informe de salida. Estos problemas se analizan en este artículo.
Las capas del mapa se pueden utilizar para definir la Clase de entidad de entrada. Cuando se utiliza una capa con una selección, solo las entidades seleccionadas se incluyen en el análisis.

Precaución:

Al utilizar shapefiles tenga en cuenta que no pueden almacenar valores nulos. Las herramientas u otros procedimientos que crean shapefiles a partir de entradas sin shapefiles pueden almacenar o interpretar valores nulos como cero. En algunos casos, los nulos se almacenan como valores negativos muy grandes en shapefiles. Esto puede ocasionar resultados inesperados. Consulte Consideraciones de geoprocesamiento para la salida del shapefile para obtener más información.

Parámetros

Etiqueta	Explicación	Tipo de datos
Clase de entidad de entrada	La clase de entidad que contiene las variables dependientes e independientes para el análisis.	Feature Layer
Campo de Id. único	Un campo de tipo entero con un valor diferente para cada entidad en la Clase de entidad de entrada.	Field
Clase de entidad de salida	La clase de entidad de salida que recibirá estimaciones y residuales de variables dependientes.	Feature Class
Variable dependiente	El campo numérico que contiene los valores de aquello que intenta modelar.	Field
Variables explicativas	Una lista de campos que representan variables explicativas en el modelo de regresión.	Field
Tabla de salida de coeficiente (Opcional)	La ruta completa a una tabla opcional que recibirá los coeficientes del modelo, coeficientes estandarizados, los errores estándar y las probabilidades para cada variable explicativa.	Table
Tabla de salida de diagnóstico (Opcional)	La ruta completa a una tabla opcional que recibirá los diagnósticos del resumen del modelo.	Table
Archivo de informe de salida (Opcional)	La ruta al archivo PDF opcional que creará la herramienta. Este archivo de informe incluye diagnóstico del modelo, gráficos y notas para ayudarle a interpretar los resultados de OLS.	File

arcpy.stats.OrdinaryLeastSquares(Input_Feature_Class, Unique_ID_Field, Output_Feature_Class, Dependent_Variable, Explanatory_Variables, {Coefficient_Output_Table}, {Diagnostic_Output_Table}, {Output_Report_File})

Nombre	Explicación	Tipo de datos
Input_Feature_Class	La clase de entidad que contiene las variables dependientes e independientes para el análisis.	Feature Layer
Unique_ID_Field	Un campo de tipo entero con un valor diferente para cada entidad en la Clase de entidad de entrada.	Field
Output_Feature_Class	La clase de entidad de salida que recibirá estimaciones y residuales de variables dependientes.	Feature Class
Dependent_Variable	El campo numérico que contiene los valores de aquello que intenta modelar.	Field
Explanatory_Variables [Explanatory_Variables,...]	Una lista de campos que representan variables explicativas en el modelo de regresión.	Field
Coefficient_Output_Table (Opcional)	La ruta completa a una tabla opcional que recibirá los coeficientes del modelo, coeficientes estandarizados, los errores estándar y las probabilidades para cada variable explicativa.	Table
Diagnostic_Output_Table (Opcional)	La ruta completa a una tabla opcional que recibirá los diagnósticos del resumen del modelo.	Table
Output_Report_File (Opcional)	La ruta al archivo PDF opcional que creará la herramienta. Este archivo de informe incluye diagnóstico del modelo, gráficos y notas para ayudarle a interpretar los resultados de OLS.	File

Muestra de código

Ejemplo 1 de OrdinaryLeastSquares (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función OrdinaryLeastSquares.

import arcpy
arcpy.env.workspace = r"c:\data"
arcpy.stats.OrdinaryLeastSquares("USCounties.shp", "MYID", "olsResults.shp", 
                                 "GROWTH","LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69",
                                 "olsCoefTab.dbf", "olsDiagTab.dbf")

Ejemplo 2 de OrdinaryLeastSquares (script independiente)

El siguiente script independiente de Python muestra cómo utilizar la función OrdinaryLeastSquares.

# Analyze the growth of regional per capita incomes in US
# Counties from 1969 -- 2002 using Ordinary Least Squares Regression

# Import system modules
import arcpy

# Set property to overwrite existing outputs
arcpy.env.overwriteOutput = True

# Local variables...
workspace = r"C:\Data"

try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace

    # Growth as a function of {log of starting income, dummy for South
    # counties, interaction term for South counties, population density}
    # Process: Ordinary Least Squares... 
    ols = arcpy.stats.OrdinaryLeastSquares("USCounties.shp", "MYID", 
                        "olsResults.shp", "GROWTH",
                        "LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69",
                        "olsCoefTab.dbf",
                        "olsDiagTab.dbf")

    # Create Spatial Weights Matrix (Can be based on input or output FC)
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.stats.GenerateSpatialWeightsMatrix("USCounties.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6) 
                        
    # Calculate Moran's Index of Spatial Autocorrelation for 
    # OLS Residuals using a SWM File.  
    # Process: Spatial Autocorrelation (Morans I)...      
    moransI = arcpy.stats.SpatialAutocorrelation("olsResults.shp", "Residual",
                        "NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE", 
                        "EUCLIDEAN_DISTANCE", "NONE", "#", 
                        "euclidean6Neighs.swm")

except:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Entornos

Sistema de coordenadas de salida, Transformaciones geográficas, Espacio de trabajo actual, Espacio de trabajo temporal, Nombres de campos calificados, La salida tiene valores M, Resolución M, Tolerancia M, La salida tiene valores Z, Valor Z de salida predeterminado, Resolución Z, Tolerancia Z, Resolución XY, Tolerancia XY

Información de licenciamiento

Basic: Sí
Standard: Sí
Advanced: Sí

Temas relacionados

¿Algún comentario sobre este tema?