¿Qué tipos de superficie de salida pueden generar los modelos de interpolación?

Disponible con una licencia de Geostatistical Analyst.

Todos los modelos de interpolación son métodos de predicción y el objetivo final es producir una superficie de valores predichos en todas las ubicaciones entre las ubicaciones medidas. Con frecuencia, también debe saber cuán precisas y fiables son las predicciones, por lo que Geostatistical Analyst ofrece varios tipos de superficies de salida diferentes para ayudarle a interpretar la superficie de predicción teniendo en cuenta la variabilidad inherente de las predicciones. Las siguientes secciones describen los distintos tipos de superficie de salida, y la tabla de la parte inferior muestra qué tipos de superficie están disponibles para cada método de interpolación.

Todos los mapas de salida suponen que ha elegido el método de interpolación correcto y elegido los parámetros de interpolación correctos. En la práctica, si los datos no cumplen con las suposiciones del método de interpolación o se proporcionan los parámetros equivocados, estas superficies pueden no representar correctamente los valores verdaderos de los datos.

Superficie de predicción

Todos los métodos de interpolación (excepto kriging de indicador y probabilidad) tienen la capacidad de crear superficies de predicción, y esta es la salida predeterminada de todos los métodos de interpolación. Esta superficie muestra el valor predicho de los datos en todas las ubicaciones entre las ubicaciones medidas.

Superficie de error estándar de la predicción

La superficie de error estándar de la predicción es un mapa de los errores estándar de los valores predichos en cada ubicación. Los errores estándar son la desviación estándar del valor estimado en cada ubicación y cuanto mayor sea el error estándar, menor será la precisión del valor predicho. Los errores estándar se suelen utilizar para crear intervalos que probablemente contengan el valor verdadero en cada ubicación predicha.

La regla 68-95-99,7

Si los datos siguen una distribución normal multivariante, puede aplicar una regla general simple para crear intervalos de confianza para el valor real en cada ubicación predicha. La regla establece que el 68% (aproximadamente dos tercios) de los valores verdaderos quedarán dentro de un error estándar del valor predicho, el 95% quedarán dentro de dos errores estándar y el 99,7% (casi todos) quedarán dentro de tres errores estándar. Por ejemplo, si una ubicación recibe un valor predicho de 100 con un error estándar de 5, puede tener una certeza del 68 por ciento de que el valor verdadero se encuentra entre 95 y 105. Del mismo modo, puede tener una seguridad del 95 por ciento de que el valor verdadero está entre 90 y 110, y puede tener casi seguro (99,7 por ciento de confianza) de que el valor verdadero está entre 85 y 115. Para crear intervalos de confianza con otros porcentajes, puede buscar valores críticos en las tablas Z, que están ampliamente disponibles en libros de texto estadísticos y en Internet.

Es muy difícil verificar que los datos sigan una distribución normal multivariante y, en la práctica, solo se verifica la normalidad univariante. Puede investigar la normalidad univariante con el gráfico de histograma.

La desigualdad de Chebyshev

Si los datos no cumplen los supuestos de la regla 68-95-99.7 o si tiene dudas de si los datos cumplen con las suposiciones, puede crear un intervalo de confianza más conservador basado en la desigualdad de Chebyshev. Establece que para toda distribución que tenga un valor medio y una varianza finitos, al menos (1-1/k2), el 100% de los valores reales estará dentro de los errores estándar k del valor predicho, donde k>1. Al definir k=2, esta desigualdad indica que al menos un 75% de los valores verdaderos estará comprendido en dos errores estándar del valor predicho. Del mismo modo, con k=3, al menos el 88,9 por ciento de los valores verdaderos se situarán en tres errores estándar del valor predicho. Se pueden utilizar otros valores de k para crear intervalos con porcentajes diferentes.

Cómo interpretar errores estándar

Los valores de error estándar se deben interpretar teniendo en cuenta los valores y el rango de los datos de entrada. Por ejemplo, si los valores de los datos de entrada están comprendidos entre 10.000 y 12.000, un valor de error estándar de 100 probablemente indicaría alta precisión en las predicciones, porque el error estándar es mucho menor que los valores y el rango de los datos de entrada. Sin embargo, si los valores de datos están comprendidos entre 50 y 200, el mismo error estándar de 100 indicaría baja precisión, porque la variabilidad de las predicciones es tan grande como los valores y el rango de los datos de entrada.

Superficie de probabilidad

Por lo general, los mapas de probabilidades se utilizan cuando hay algún valor de interés crítico, como el nivel nacional estándar de un contaminante. Este valor crítico se denomina umbral y el mapa de salida mostrará la probabilidad de que se supere este valor de umbral o no se supere. Estos mapas resultan útiles para ver qué áreas tienen mayor o menor probabilidad de superar o no este umbral crítico.

Superficie de cuantiles

Los mapas de cuantiles muestran un cuantil especificado de la distribución de la predicción en cada ubicación. Normalmente, los mapas de cuantiles se utilizan como preparación para escenarios más favorables y más desfavorables. Por ejemplo, en lugar de crear un mapa con valores predichos, puede crear un mapa de los cuantiles 95 de los valores predichos. En este caso, solo el 5 por ciento de los valores verdaderos excederá el valor de la superficie de cuantil. Del mismo modo, si crea un mapa de los cuantiles 10, solo el 10 por ciento de los valores verdaderos será menor que el valor de la superficie de cuantiles.

Superficie de errores estándar de indicadores

Una variable de indicador es una variable binaria que solo toma los valores 0 y 1. Todos, el kriging de indicador, de probabilidad y disyuntivo calculan mapas de probabilidades reclasificando los datos de entrada como 0 o 1 en función de un valor de umbral; los valores menores que el umbral se reclasifican como 0 y los valores mayores que el umbral se reclasifican como 1. Después de interpolar la variable de indicador, el mapa de predicción calcula el valor esperado de la variable de indicador, y este valor esperado se puede interpretar como la probabilidad de que la variable de indicador sea igual a uno (es decir, se supera el valor de umbral). Por tanto, los errores estándar del mapa de salida de indicadores son una superficie de los errores estándar del valor esperado de la variable de indicador; es decir, es el error estándar de la probabilidad de que se sobrepase el valor del umbral.

Dado que las variables de indicador no se pueden distribuir normalmente, no puede utilizar la regla 68-95-99,7 con variables de indicador. Para crear intervalos de confianza para la probabilidad de que se sobrepase un umbral, se puede utilizar la desigualdad de Chebyshev.

Superficie del número de condición

La superficie del número de condición es una salida opcional para la interpolación polinómica local, y la superficie se utiliza para determinar la estabilidad del valor predicho en cada ubicación de predicción. Los números de condición son difíciles de interpretar literalmente, pero cuanto mayor sea el número de condición, mayor es la inestabilidad de las predicciones. En este caso, la estabilidad significa la cantidad que el valor predicho cambiará para un pequeño cambio en los datos de entrada o pequeños cambios en los parámetros de interpolación. La regla general para los números de condición en la interpolación polinómica local es que, para los polinomios de primer orden, los números de condición no deben pasar de 10. Para los polinomios de segundo orden, los números de condición no deben superar los 100, y para los polinomios de tercer orden, el número de condición no debe ser superior a 1.000. Por lo general, no se recomiendan las órdenes polinómicas superiores a tres.

¿Qué tipos de superficie de salida están disponibles para cada método de interpolación?

En la siguiente tabla, el símbolo Permitido indica los tipos de superficie de salida disponibles para cada método de interpolación.

Método de interpolaciónPrediccionesErrores estándar de la predicciónMapas de cuantilesMapas de probabilidadesErrores estándar de indicadoresNúmero de condición

Kriging ordinario

Compatibles

Compatibles

Admitido 1

Admitido 1

Kriging universal

Compatibles

Compatibles

Admitido 1

Admitido 1

Kriging simple

Compatibles

Compatibles

Admitido 1

Admitido 1

Kriging de indicador

Compatibles

Compatibles

Kriging de probabilidad

Compatibles

Compatibles

Kriging disyuntivo

Admitido 2

Admitido 2

Admitido 2

Admitido 2

EBK Regression Prediction

Compatibles

Admitido 5

Admitido 5

Admitido 5

Kriging bayesiano empírico

Compatibles

Compatibles

Admitido 1

Admitido 1

Kriging bayesiano empírico 3D

Compatibles

Compatibles

Admitido 1

Admitido 1

Interpolación de área

Compatibles

Compatibles

Interpolación de difusión con barreras

Compatibles

Interpolación polinómica global

Compatibles

IDW

Compatibles

Interpolación kernel con barreras

Compatibles

Admitido 3

Interpolación polinómica local

Compatibles

Admitido 4

Admitido 4

Funciones de base radial

Compatibles

Métodos de interpolación y tabla de superficies de salida

1 Requiere suposición de distribución normal multivariante.

2 Requiere suposición de normalidad bivariante por pares.

3 El orden polinómico debe estar establecido en 1.

4 Se debe utilizar un umbral del número de condición espacial.

5 La salida se debe crear con GA Layer to Rasters.