Resumen
Realiza una regresión lineal global de Mínimos cuadrados ordinarios (OLS) para generar una predicción o modelar una variable dependiente en términos de sus relaciones con un conjunto de variables explicativas.
Nota:
La funcionalidad de esta herramienta se incluye en la herramienta Regresión lineal generalizada agregada a ArcGIS Pro 2.3. La herramienta Regresión lineal generalizada admite más modelos.
Más información sobre cómo funciona la regresión de Mínimos cuadrados ordinarios
Ilustración
Uso
-
La salida principal de esta herramienta es un archivo de informe que se escribe como mensajes en la parte inferior del panel Geoprocesamiento durante la ejecución de la herramienta. Puede acceder a los mensajes desplazándose sobre la barra de progreso, haciendo clic en el botón emergente o expandiendo la sección de mensajes en el panel Geoprocesamiento. También puede acceder a los mensajes de una ejecución anterior de Regresión exploratoria a través del historial de geoprocesamiento.
-
La herramienta OLS también produce una clase de entidad de salida y tablas opcionales con diagnósticos e información de coeficiente. Se puede acceder a todo esto desde los mensajes de la parte inferior del panel Geoprocesamiento. La clase de entidad de salida se agrega automáticamente a la Tabla de contenido con un esquema de representación cálido/frío que se aplica a los residuales del modelo. Se proporciona una explicación completa de cada salida en Cómo funciona la regresión de OLS.
-
Los resultados de la regresión OLS son confiables solo si los datos y el modelo de regresión satisfacen todas las presuposiciones que este método requiere inherentemente. Consulte la tabla Problemas, consecuencias y soluciones comunes de regresión en Conceptos básicos del análisis de regresión para asegurarse de que su modelo esté adecuadamente especificado.
-
Las variables dependientes y explicativas deben ser campos numéricos que contengan una variedad de valores. Los OLS no pueden generar resultados cuando las variables tienen el mismo valor (por ejemplo, todos los valores de un campo son 9,0). Los métodos de regresión lineal, como OLS, no son adecuados para predecir resultados binarios (por ejemplo, todos los valores de la variable dependiente son 1 o 0).
-
El campo Unique ID vincula las predicciones del modelo con cada entidad. Como consecuencia, los valores de Unique ID deben ser únicos para cada entidad y, por lo general, deben ser un campo permanente que se mantiene con la clase de entidad. Si no tiene ningún campo de Unique ID, puede crear uno agregando un nuevo campo de tipo entero a la tabla de clases de entidad y calculando los valores de campo para que sean iguales a los del campo FID/OID. No puede utilizar el campo FID/OID directamente para el parámetro Id. único.
-
Siempre que exista una autocorrelación espacial estadísticamente significativa de los residuales de regresión, se considerará que el modelo OLS no se ha especificado correctamente. Como consecuencia, los resultados de la regresión de OLS no son fiables. Asegúrese de ejecutar la herramienta Autocorrelación espacial en los residuales de la regresión para evaluar este problema potencial. La autocorrelación espacial estadísticamente significativa de los residuales de regresión casi siempre indica la ausencia de una o más variables explicativas clave en el modelo.
-
Inspeccione visualmente las sobrepredicciones y las subpredicciones que sean evidentes en los residuales de regresión para ver si ofrecen pistas sobre las posibles variables que falten en el modelo de regresión. Podría ayudarle a ejecutar el Análisis de punto caliente en los residuales para visualizar el clustering espacial de las sobrepredicciones y las subpredicciones.
-
Cuando se produce una especificación incorrecta como resultado del intento de modelar variables no estacionarias con un modelo global (OLS es un modelo global), se puede utilizar una Regresión ponderada geográficamente para mejorar las predicciones y comprender mejor la ausencia de estacionariedad (variación regional) inherente en las variables explicativas.
-
Cuando el resultado de un cálculo es infinito o indefinido, la salida para los no shapefiles será Nulo; para los shapefiles la salida será -DBL_MAX (-1,7976931348623158e+ 308, por ejemplo).
-
Los diagnósticos del resumen del modelo se escriben en el informe de resumen de OLS y la tabla de salida de diagnóstico opcional. Ambos incluyen diagnósticos para el Criterio de información de Akaike corregido (AICc), el Coeficiente de determinación, el índice estadístico F conjunto, el índice estadístico de Wald, el índice estadístico Breusch-Pagan de Koenker y el índice estadístico de Jarque-Bera. La tabla de diagnóstico también incluye valores AIC y Sigma cuadrado sin corregir.
-
Las tablas de salida de coeficiente y diagnóstico opcionales se sobrescribirán, si ya existen, cuando la opción Permitir que las herramientas de geoprocesamiento sobrescriban los datasets existentes esté activada.
-
En los equipos configurados con los paquetes de idiomas de ArcGIS para árabe y otros idiomas que se escriben de derecha a izquierda, es posible que observe que falta texto o que detecte problemas de formato en el PDF Archivo de informe de salida. Estos problemas se analizan en este artículo.
-
Las capas del mapa se pueden utilizar para definir la Clase de entidad de entrada. Cuando se utiliza una capa con una selección, solo las entidades seleccionadas se incluyen en el análisis.
Precaución:
Al utilizar shapefiles tenga en cuenta que no pueden almacenar valores nulos. Las herramientas u otros procedimientos que crean shapefiles a partir de entradas sin shapefiles pueden almacenar o interpretar valores nulos como cero. En algunos casos, los nulos se almacenan como valores negativos muy grandes en shapefiles. Esto puede ocasionar resultados inesperados. Consulte Consideraciones de geoprocesamiento para la salida del shapefile para obtener más información.
Sintaxis
arcpy.stats.OrdinaryLeastSquares(Input_Feature_Class, Unique_ID_Field, Output_Feature_Class, Dependent_Variable, Explanatory_Variables, {Coefficient_Output_Table}, {Diagnostic_Output_Table}, {Output_Report_File})
Parámetro | Explicación | Tipo de datos |
Input_Feature_Class | La clase de entidad que contiene las variables dependientes e independientes para el análisis. | Feature Layer |
Unique_ID_Field | Un campo de tipo entero con un valor diferente para cada entidad en la Clase de entidad de entrada. | Field |
Output_Feature_Class | La clase de entidad de salida que recibirá estimaciones y residuales de variables dependientes. | Feature Class |
Dependent_Variable | El campo numérico que contiene los valores de aquello que intenta modelar. | Field |
Explanatory_Variables [Explanatory_Variables,...] | Una lista de campos que representan variables explicativas en el modelo de regresión. | Field |
Coefficient_Output_Table (Opcional) | La ruta completa a una tabla opcional que recibirá los coeficientes del modelo, coeficientes estandarizados, los errores estándar y las probabilidades para cada variable explicativa. | Table |
Diagnostic_Output_Table (Opcional) | La ruta completa a una tabla opcional que recibirá los diagnósticos del resumen del modelo. | Table |
Output_Report_File (Opcional) | La ruta al archivo PDF opcional que creará la herramienta. Este archivo de informe incluye diagnóstico del modelo, gráficos y notas para ayudarle a interpretar los resultados de OLS. | File |
Muestra de código
El siguiente script de la ventana de Python muestra cómo utilizar la herramienta OrdinaryLeastSquares.
import arcpy
arcpy.env.workspace = r"c:\data"
arcpy.OrdinaryLeastSquares_stats("USCounties.shp", "MYID","olsResults.shp",
"GROWTH","LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69",
"olsCoefTab.dbf","olsDiagTab.dbf")
El siguiente script de Phython independiente muestra cómo utilizar la herramienta OrdinaryLeastSquares.
# Analyze the growth of regional per capita incomes in US
# Counties from 1969 -- 2002 using Ordinary Least Squares Regression
# Import system modules
import arcpy
# Set property to overwrite existing outputs
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\Data"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Growth as a function of {log of starting income, dummy for South
# counties, interaction term for South counties, population density}
# Process: Ordinary Least Squares...
ols = arcpy.OrdinaryLeastSquares_stats("USCounties.shp", "MYID",
"olsResults.shp", "GROWTH",
"LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69",
"olsCoefTab.dbf",
"olsDiagTab.dbf")
# Create Spatial Weights Matrix (Can be based on input or output FC)
# Process: Generate Spatial Weights Matrix...
swm = arcpy.GenerateSpatialWeightsMatrix_stats("USCounties.shp", "MYID",
"euclidean6Neighs.swm",
"K_NEAREST_NEIGHBORS",
"#", "#", "#", 6)
# Calculate Moran's Index of Spatial Autocorrelation for
# OLS Residuals using a SWM File.
# Process: Spatial Autocorrelation (Morans I)...
moransI = arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual",
"NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE",
"EUCLIDEAN_DISTANCE", "NONE", "#",
"euclidean6Neighs.swm")
except:
# If an error occurred when running the tool, print out the error message.
print(arcpy.GetMessages())
Entornos
Información de licenciamiento
- Basic: Sí
- Standard: Sí
- Advanced: Sí
Temas relacionados
- Vista general del conjunto de herramientas Modelado de relaciones espaciales
- Cómo funciona Regresión ponderada geográficamente (GWR)
- Conceptos básicos del análisis de regresión
- Regresión ponderada geográficamente (GWR)
- Autocorrelación espacial (I de Moran)
- Análisis de puntos calientes (Gi* de Getis-Ord)
- ¿Qué es una puntuación z? ¿Qué es un valor P?
- Cómo funciona la regresión OLS
- Lo que no le cuentan sobre el análisis de regresión
- Regresión exploratoria
- Interpretar los resultados de Regresión exploratoria
- Cómo funciona la regresión exploratoria
- Buscar una herramienta de geoprocesamiento