Vocabulario esencial de Geostatistical Analyst

Disponible con una licencia de Geostatistical Analyst.

Los siguientes términos y conceptos se repiten en las geoestadísticas y en Geostatistical Analyst.

PlazoDescripción

Validación cruzada

Técnica utilizada para evaluar la precisión de un modelo de interpolación. En Geostatistical Analyst, la validación cruzada excluye un punto y utiliza el resto para predecir un valor en esa ubicación. Después, el punto se vuelve a agregar al dataset y se elimina otro distinto. Esto se realiza en todas las muestras del dataset y se obtienen pares de valores predichos y conocidos que se pueden comparar para evaluar el rendimiento del modelo. Los resultados se suelen resumir como error medio y error cuadrático medio.

Métodos determinísticos

En Geostatistical Analyst, los métodos determinísticos son aquellos que crean superficies a partir de puntos medidos en función de una extensión de la similitud (por ejemplo, distancia inversa ponderada) o un grado de suavizado (por ejemplo, funciones de base radial). No proporcionan una medida de incertidumbre (error) de las predicciones.

Capa de estadísticas geográficas

Los resultados generados por muchas de las herramientas de geoprocesamiento de la caja de herramientas de Geostatistical Analyst se almacenan en una superficie denominada capa de estadísticas geográficas. Las capas de estadísticas geográficas se pueden usar para crear mapas de los resultados, ver y revisar los valores de los parámetros del método de interpolación, crear otros tipos de capas de estadísticas geográficas (como mapas de errores de predicción) y exportar los resultados a formatos ráster o vectoriales (curva de nivel, curva de nivel rellena y puntos).

Métodos de estadísticas geográficas

En Geostatistical Analyst, los métodos de estadísticas geográficas son aquellos que están basados en modelos estadísticos que incluyen la autocorrelación (las relaciones estadísticas entre los puntos medidos). Estas técnicas tienen la capacidad de producir superficies de predicción y también alguna medida de la incertidumbre (error) asociada a estas predicciones.

Interpolación

Proceso que utiliza valores medidos tomados en ubicaciones de muestra conocidas para predecir (estimar) valores de ubicaciones no muestreadas. Geostatistical Analyst ofrece varios métodos de interpolación, que se diferencian por sus suposiciones subyacentes, requisitos de datos y capacidades para generar distintos tipos de salida (por ejemplo, valores predichos y los errores [incertidumbres] asociados a ellos).

Kernel

Función de ponderación utilizada en varios de los métodos de interpolación ofrecidos en Geostatistical Analyst. Normalmente, se asignan ponderaciones más altas a los valores de muestra próximos a la ubicación en la que se realiza una predicción y ponderaciones más bajas a los valores de muestra más alejados.

Kriging

Conjunto de métodos de interpolación que se basan en modelos de semivariograma de autocorrelación espacial para generar valores predichos, errores asociados a las predicciones y otra información relativa a la distribución de los posibles valores para cada ubicación del área de estudio (mediante mapas de cuantiles y de probabilidades, o a través de la simulación de estadísticas geográficas, que proporciona un conjunto de valores posibles para cada ubicación).

Vecindad de búsqueda

La mayoría de los métodos de interpolación usan un subconjunto local de los datos para hacer predicciones. Imagínese una ventana móvil; solamente se utilizan los datos incluidos dentro de la ventana para hacer una predicción en el centro de la misma. Se hace así porque hay información redundante en las muestras que están alejadas de la ubicación en la que necesitamos hacer una predicción y para acelerar el tiempo de procesamiento requerido para generar un valor predicho para toda el área de estudio. La elección de la vecindad (número de muestras cercanas y su configuración espacial dentro de la ventana) afectará a la superficie de predicción, por lo que se debe elegir con cuidado.

Semivariograma

Función que describe las diferencias (varianza) entre muestras separadas por diferentes distancias. Normalmente, el semivariograma mostrará una varianza baja en el caso de diferencias pequeñas y varianzas más grandes a distancias de separación mayores, lo que indica que los datos están autocorrelacionados espacialmente. Los semivariogramas estimados a partir de datos de muestra son semivariogramas empíricos. Se representan como un conjunto de puntos en un gráfico. Se ajusta una función a estos puntos, conocida como modelo de semivariograma. El modelo de semivariograma es un componente clave en el kriging (un eficaz método de interpolación capaz de proporcionar valores predichos, errores asociados a las predicciones e información sobre la distribución de los posibles valores para cada ubicación del área de estudio).

Simulación

En las geoestadísticas, se refiere a una técnica que amplía el kriging al producir muchas versiones posibles de una superficie predicha (a diferencia del kriging, que produce una sola superficie). El conjunto de superficies predichas proporciona una gran cantidad de información que se puede utilizar para describir la incertidumbre de un valor predicho para una ubicación determinada, la incertidumbre de un conjunto de valores predichos en un área de interés o un conjunto de valores predichos que se pueden usar como datos entrantes para un segundo modelo (físico, económico, etc.) a fin de evaluar el riesgo y tomar decisiones más informadas.

Autocorrelación espacial

A menudo, los fenómenos naturales presentan autocorrelación espacial, es decir, que los valores de muestras tomadas una cerca de otra son más similares que las muestras tomadas lejos una de otra. Algunos métodos de interpolación requieren un modelo explícito de autocorrelación espacial (por ejemplo, kriging), otros se basan en los grados supuestos de autocorrelación espacial sin proporcionar un medio para medirla (por ejemplo, Ponderación de distancia inversa) y otros no requieren ninguna noción de la autocorrelación espacial en el dataset. Tenga en cuenta que, cuando existe autocorrelación espacial, los métodos estadísticos tradicionales (que se basan en la independencia entre las observaciones) no se pueden usar de forma fiable.

Transformación

Una transformación de datos se realiza cuando se aplica una función (logarítmica, Box-Cox, arcoseno, puntuación normal) a los datos para cambiar la forma de su distribución o estabilizar la varianza (reducir la relación entre el valor medio y la varianza, por ejemplo, en la que la variabilidad de los datos aumenta a medida que aumenta el valor medio).

Validación

Similar a la validación cruzada, pero, en lugar de utilizar el mismo dataset para crear y evaluar el modelo, se utilizan dos datasets: uno para crear el modelo y otro como prueba independiente de rendimiento. Si solo hay un dataset disponible, se puede usar la herramienta Subconjuntos de entidades para dividirlo aleatoriamente en subconjuntos de entrenamiento y prueba.

Vocabulario esencial de Geostatistical Analyst