Cómo funciona la interpolación polinómica local

Disponible con una licencia de Geostatistical Analyst.

Mientras que la interpolación polinómica global ajusta un polinomio a toda la superficie, la interpolación polinómica local ajusta muchos polinomios, cada uno dentro de vecindades superpuestas especificadas. La vecindad de búsqueda se puede definir utilizando el tamaño y la forma, el número de vecinos y la configuración de sectores. Como alternativa, se puede utilizar el parámetro Análisis exploratorio de superficie de tendencia para variar simultáneamente los valores de Ancho de banda, Número de condición espacial (si está habilitado) y Vecindad de búsqueda.

Un polinomio global de primer orden fija un solo plano a través de los datos; un polinomio global de segundo orden ajusta una superficie con un doblez, lo que permite que las superficies representen valles; un polinomio global de tercer orden permite dos dobleces; y así sucesivamente. Sin embargo, cuando una superficie tiene una forma variable, como un paisaje con una pendiente, un plano y otra pendiente, un polinomio global único no se ajustará bien. Varios planos polinómicos podrían representar la superficie con más precisión, como se muestra en la siguiente ilustración:

Interpolación polinómica local
Ilustración de una interpolación polinómica local

Por otro lado, la interpolación polinómica local ajusta el polinomio del orden especificado (cero, primero, segundo, tercero, etc.) utilizando solo los puntos dentro de la vecindad definida. Las vecindades se superponen y el valor utilizado para cada predicción es el valor del polinomio ajustado en el centro de la vecindad.

En la siguiente imagen, se toma una sección transversal de los datos de elevación de muestra (un transecto). En la primera imagen, se utilizan tres vecinos (los puntos rojos) para ajustar un polinomio de primer orden y una línea (la línea roja) para predecir el valor desconocido de la ubicación identificada por el punto azul. En la segunda imagen, se predice una segunda ubicación (el punto amarillo) mediante otro polinomio de primer orden. Está muy cerca de la primera ubicación y se utilizan los mismos puntos medidos en las predicciones, pero las ponderaciones serán un poco distintas y, por tanto, el ajuste polinómico (la línea azul) es ligeramente diferente.

Polinomio de primer orden
Polinomio de primer orden

Este proceso continúa, centrándose en ubicaciones de predicción posteriores y ajustando polinomios locales para predecir los valores. Las dos imágenes siguientes muestran cómo se predicen dos puntos arbitrarios más para crear la superficie final. El punto naranja se predice a partir del polinomio ajustado (la línea verde) utilizando los puntos de muestra medidos de color verde y el punto marrón se predice a partir del polinomio morado claro.

Polinomio local
Polinómico local

En las dos imágenes siguientes, se ajustan dos polinomios más (las líneas amarilla y gris) para predecir dos ubicaciones más (los puntos verde azulado y verde).

Polinomio local
Polinómico local

Este proceso continúa para cada ubicación. A continuación, puede ver cómo se crea la superficie (la línea de superficie morada) para los puntos de muestra.

Polinomio local

Medidas de precisión

La interpolación polinómica local proporciona las dos medidas de precisión siguientes, que no están disponibles para los demás métodos de interpolación determinísticos ofrecidos en ArcGIS Geostatistical Analyst:

  • Los errores estándar de la predicción indican la incertidumbre asociada al valor predicho para cada ubicación.
  • El número de condición espacial es una medida del grado de estabilidad o inestabilidad de la solución de las ecuaciones de predicción para una ubicación específica. Si el número de condición es grande, un pequeño cambio en los coeficientes de la matriz dará como resultado un gran cambio en el vector de la solución (coeficientes de regresión). La superficie del número de condición espacial muestra la variación de la estabilidad del modelo numérico y proporciona información adicional sobre la incertidumbre de la predicción, ya que la superficie del error estándar de la predicción se crea presuponiendo que el modelo es correcto.

La interpolación polinómica local será más precisa si los datos tienen las siguientes propiedades:

  • Las muestras se tomaron en una cuadrícula (es decir, las muestras son equidistantes).
  • Los valores de datos, dentro de la vecindad de búsqueda, están distribuidos normalmente.

En la práctica, la mayoría de los datasets no tendrán estas propiedades. En esos casos, los valores predichos se verán afectados, pero no tanto como los errores estándar de la predicción. Para ayudarle a decidir si los resultados de ciertas áreas son fiables o no, LPI proporciona una superficie de número de condición espacial. En la siguiente tabla se muestran valores de regla general y estos valores críticos se renderizan en amarillo en la superficie del número de condición:

Orden del polinomioValor de umbral del número de condición espacial crítico

1

10

2

100

3

1000

Mayor que 3

No recomendado en la mayoría de las situaciones

Los valores que están por debajo de los umbrales del número de condición espacial crítico indican en qué ubicaciones son fiables las soluciones. Los valores cercanos o iguales a los valores críticos son cuestionables (se deben examinar con cuidado) y los valores que están por encima de los límites críticos no son fiables.

Los números de condición espacial se generan evaluando la sensibilidad del valor predicho a pequeños cambios en los coeficientes de las ecuaciones de predicción lineal. Un número de condición espacial pequeño indica que la solución es estable, mientras que un valor grande indica que la solución es inestable. La inestabilidad de la solución debe ser un motivo de preocupación si se produce en áreas de especial interés, ya que pequeñas variaciones en los datos de entrada (incluidos sus valores, ubicaciones y distribución espacial) pueden provocar grandes variaciones en el valor predicho. Esto significa que cualquier incertidumbre asociada a los datos de entrada (por ejemplo, errores en mediciones de atributos o imprecisiones en las coordenadas donde se realizó la medición) y, en especial, los valores atípicos de los datos pueden tener un impacto considerable en los valores predichos. Asimismo, los cambios en la vecindad de búsqueda modifican el número de puntos de datos (y las ponderaciones, en el caso de una vecindad de búsqueda suave) que se utilizan para hacer una predicción y pueden afectar al número de condición espacial de esa ubicación.

La superficie del número de condición espacial se crea para los polinomios de orden 1, 2 y 3. El error estándar de la predicción se estima presuponiendo que el modelo de LPI es correcto (es decir, la regresión de mínimos cuadrados ponderados local es un algoritmo adecuado y los valores de los números de condición espacial son menores que los valores de umbral de los números de condición espacial de la tabla de arriba).

Puede excluir áreas en las que se producen números de condición altos en los mapas de predicción y de errores estándar de la predicción configurando Usar umbral de número de condición espacial como True en el cuadro de diálogo de LPI. El número de condición depende solo de las ubicaciones de los puntos de entrada, no de sus valores propiamente dichos. En otras palabras, independientemente de si se utilizan los valores de ozono o los de elevación procedentes del mismo dataset como entrada para LPI, la superficie del número de condición seguirá siendo la misma.

Para datos distribuidos regularmente, los kernels constante, de Epanechnikov y cuártico son los mejores desde un punto de vista teórico para polinomios de orden 0, 1 y 2, respectivamente. Para datos distribuidos irregularmente, la selección del mejor kernel debe basarse en los diagnósticos de validación y validación cruzada y en los valores de los números de condición espacial.

Interpolación kernel con barreras es una variante de LPI. Las inestabilidades locales en estos resultados se corrigen utilizando una técnica similar a la regresión de cresta. La contrapartida es que los valores predichos están ligeramente sesgados y, en la mayoría de las situaciones prácticas, el sesgo no es suficiente para afectar a las decisiones que tome basándose en los valores predichos.

Agujeros en la superficie

Si el parámetro Usar umbral del número de condición espacial está marcado, puede haber "agujeros" en la superficie de salida. Se trata de áreas en las que se supera el Umbral del número de condición espacial o donde la vecindad de búsqueda es demasiado pequeña. Los parámetros de vecindad de búsqueda y el Umbral del número de condición espacial se pueden ajustar para rellenar estas áreas; sin embargo, se debe tener en cuenta que estos agujeros se crearon donde es posible que haya inestabilidad en el cálculo de los valores de predicción.

Cuándo utilizar la interpolación polinómica local

La interpolación polinómica global resulta útil para crear superficies suaves e identificar tendencias de largo alcance en el dataset. Sin embargo, en las ciencias de la Tierra, la variable de interés suele tener una variación de corto alcance además de una tendencia de largo alcance. Cuando el dataset muestra una variación de corto alcance, los mapas de interpolación polinómica local pueden capturar la variación de corto alcance.

La interpolación polinómica local es sensible a la distancia de la vecindad, y una vecindad de búsqueda pequeña puede crear áreas vacías en la superficie de predicción. Por este motivo, puede obtener una vista previa de la superficie antes de producir la capa de salida.

Temas relacionados