Esta herramienta de geoprocesamiento está disponible con ArcGIS Enterprise 10.8.1 o posterior.
Esta herramienta realiza una Regresión ponderada geográficamente (GWR), una forma local de regresión que se utiliza para modelar las relaciones que varían espacialmente. La herramienta GWR ofrece un modelo local de la variable o el proceso que trata de comprender o predecir ajustando una ecuación de regresión a todas las entidades del dataset. La herramienta Regresión ponderada geográficamente (GWR) crea dichas ecuaciones separadas incorporando las variables dependientes y explicativas de entidades que se encuentran dentro de la vecindad de cada entidad de destino. La forma y extensión de todas las vecindades que se analizan se basan en la entrada de los parámetros Tipo de vecindad y Método de selección de vecindad.
Para obtener los mejores resultados, aplique la herramienta GWR a datasets con varios cientos de entidades. No es una herramienta adecuada para datasets pequeños. La herramienta no funciona con datos de multipunto.
Use el parámetro Entidades de entrada con un campo que represente el fenómeno que está modelando (la Variable dependiente) y uno o varios campos que representen los valores de parámetros de las Variables explicativas. Estos campos deben ser numéricos y tener un rango de valores. Las entidades que contienen valores que faltan en las variables explicativa o dependiente se excluirán del análisis. Puede utilizar la herramienta Calcular campo para modificar valores. Si los datos están disponibles para su uso en ArcGIS Pro, utilice la herramienta Rellenar valores que faltan para agregar los valores que falten al dataset antes de ejecutar la herramienta Regresión ponderada geográficamente (GWR).
La herramienta Regresión ponderada geográficamente (GWR) también produce entidades de salida y agrega campos que reportan valores de diagnóstico locales. Las valores de parámetros de Entidades de salida y los gráficos asociados se agregan automáticamente a la tabla de contenido con un esquema de representación cálido/frío que se aplica a los residuales del modelo. En Cómo funciona la regresión ponderada geográficamente (GWR) se proporciona una explicación completa de cada salida.
La herramienta Regresión ponderada geográficamente (GWR) produce una variedad de salidas. Dispone de un resumen del modelo GWR como un mensaje en la parte inferior del panel Geoprocesamiento durante la ejecución de la herramienta. Puede acceder al mensaje desplazándose sobre la barra de progreso, haciendo clic en el botón emergente o expandiendo la sección de mensajes en el panel Geoprocesamiento. También puede acceder a los mensajes de la herramienta Regresión ponderada geográficamente (GWR) ejecutada anteriormente mediante el historial de geoprocesamiento.
Debe utilizar los datos proyectados.
Es una práctica habitual explorar datos globalmente con la herramienta Regresión lineal generalizada antes de explorar datos de forma local con la herramienta Regresión ponderada geográficamente (GWR).
Los parámetros Variable dependiente y Variables explicativas deben ser campos numéricos con una serie de valores. Estos valores deben variar tanto globalmente como localmente. Por este motivo, no utilice variables explicativas falsas para representar regímenes espaciales diferentes en un modelo GWR (como asignar un valor de 1 a los distritos censales que están fuera del núcleo urbano, mientras que al resto se les asigna un valor de 0). Como la herramienta Regresión ponderada geográficamente (GWR) permite que los coeficientes de la variable explicativa varíen, estas variables explicativas del régimen espacial no son necesarias, y si se incluyen, crearán problemas con la multicolinealidad local.
En los modelos de regresión global, como la Regresión lineal generalizada, los resultados son poco fiables cuando dos o más variables exhiben multicolinealidad (cuando dos o más variables son redundantes o cuentan la misma historia). La herramienta Regresión ponderada geográficamente (GWR) construye una ecuación de regresión local para cada entidad del dataset. Cuando los valores para una variable explicativa particular se agrupan espacialmente en clústeres, es muy probable que tenga problemas con la multicolinealidad local. El campo del número de condición ajustado (COND_ADJ) de la clase de entidad de salida indica el momento en el que los resultados son inestables debido a la multicolinealidad local. En general, sospeche de resultados para entidades con número de condición ajustado mayor que 30, igual que Nulo o, para los shapefiles, igual a -1,7976931348623158e+308.
Tenga cuidado al incluir datos nominales o categóricos en un modelo GWR. Donde las categorías se agrupan espacialmente, existe el riesgo de encontrar problemas de multicolinealidad local. El número de condición ajustado incluido en la salida de GWR indica cuándo es un problema la colinealidad local (un número de condición ajustado menor que 0, mayor que 30 o establecido en Nulo). Cuando existe una multicolinealidad local, los resultados son inestables.
Un modelo de regresión está mal especificado si falta una variable explicativa clave. Si la autocorrelación espacial de los residuales de regresión o la variación espacial no esperada entre los coeficientes de una o más variables explicativas son estadísticamente significativas, se puede intuir que el modelo está mal especificado. Debe hacer todo posible (por ejemplo, a través del análisis de residual GLR y el análisis de variación del coeficiente GWR) para descubrir las variables clave que faltan e incluirlas en el modelo.
Pregúntese siempre si tiene sentido que una variable explicativa sea no estacionaria. Por ejemplo, supongamos que está modelando la densidad de una especie de planta en particular como función de muchas variables, incluida ASPECT. Si descubre que el coeficiente de la variable ASPECT cambia en el área de estudio, es probable que sea la prueba de que falta una variable explicativa clave (tal vez, la prevalencia de una vegetación rival, por ejemplo). Debe hacer todo el esfuerzo posible para incluir todas las variables explicativas clave en el modelo de regresión.
Cuando el resultado de un cómputo es infinito o indefinido, el resultado para los no shapefiles será Nulo.
Los problemas graves de diseño del modelo o los errores que indican que las ecuaciones locales no incluyen suficientes vecinos, por lo general señalan que existe un problema con la multicolinealidad global o local. Para determinar dónde está el problema, ejecute un modelo global con Regresión lineal generalizada y examine el valor VIF para cada variable explicativa. Si algunos de los valores VIF son grandes (por ejemplo, mayores que 7,5), la multicolinealidad global impide que se resuelva la RPG. Sin embargo, es más probable que la multicolinealidad local sea el problema. Intente crear un mapa temático para cada variable explicativa. Si el mapa muestra un clustering espacial de valores idénticos, considere quitar esas variables del modelo o combinarlas con otras variables explicativas para aumentar la variación del valor. Por ejemplo, si está modelando valores de viviendas y tiene variables tanto para los dormitorios como para cuartos de baño, puede combinarlas para aumentar la variación del valor o para representarlas como metros cuadrados de cuarto de baño/dormitorio. Evite utilizar variables falsas del régimen espacial, clustering espacial de variables categóricas o nominales o variables con pocos valores posibles al construir modelos GWR.
Regresión ponderada geográficamente es un modelo lineal sujeto a los mismos requisitos que Regresión lineal generalizada. Consulte los diagnósticos explicados en Cómo funciona la regresión ponderada geográficamente (GWR) para asegurarse de que su modelo de GWR esté especificado correctamente. No todos los diagnósticos descritos están disponibles en la caja de herramientas de GeoAnalytics Desktop. La sección Cómo dejan de funcionar los modelos de regresión del tema Conceptos básicos del análisis de regresión también incluye información para asegurarse de que su modelo sea preciso.
Es posible mejorar el rendimiento de la herramienta Regresión ponderada geográficamente (GWR) mediante una o todas las acciones siguiente:
- Defina el entorno de extensión para analizar únicamente datos de interés.
- Reduzca el número de vecinos de su cálculo.
- Utilice la opción Número de vecinos en lugar de la opción Banda de distancia del parámetro Tipo de vecindad (neighborhood_type = "NUMBER OF NEIGHBORS" en Python).
- Utilice menos variables explicativas cuando sea posible.
- Utilice datos locales en los que se ejecute el análisis.
Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en su GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.
Al ejecutar herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para su GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.
Más información acerca del uso compartido de datos en el portal
Más información sobre cómo crear un archivo compartido de Big Data mediante Server Manager
También se puede completar un análisis similar con la herramienta Regresión ponderada geográficamente de la caja de herramientas Estadísticas espaciales. Utilice la herramienta de la caja de herramientas Estadísticas espaciales para completar los siguientes flujos de trabajo:
- Utilice capas locales de su equipo de ArcGIS Pro (por ejemplo, clases de entidad de una geodatabase de archivos).
- Realice una predicción en otra capa o cree una capa de coeficiente ráster.
- Modele una variable binaria (logística) o una variable de recuento (valor Poisson).
- Defina la búsqueda en la vecindad con búsqueda dorada o intervalos manuales.