Cómo funciona Simulaciones de estadísticas geográficas gaussianas

Disponible con una licencia de Geostatistical Analyst.

Cómo se generan las realizaciones

Simulaciones de estadísticas geográficas gaussianas crea primero una cuadrícula de valores asignados aleatoriamente extraídos de una distribución normal estándar (valor medio = 0 y varianza = 1). El modelo de covarianza (del semivariograma especificado en la capa de kriging simple, que se requiere como entrada para la simulación) se aplica a continuación al ráster. De este modo, se garantiza que los valores del ráster se ajusten a la estructura espacial detectada en el dataset de entrada. El ráster resultante constituye una sola realización no condicional y se pueden producir muchas más utilizando un ráster diferente de valores distribuidos normalmente cada vez. Los detalles de este método se pueden leer en Dietrich y Newsam (1993).

Si se ha seleccionado la simulación condicional, los rásteres no condicionales se condicionan mediante kriging. Este proceso utiliza la estimación (predicción) con kriging en cada ubicación para garantizar que los valores simulados respeten los valores de los datos de entrada y que, en promedio, las predicciones con kriging se repliquen. En Journel (1974) se pueden consultar los detalles para el condicionamiento de las realizaciones mediante kriging.

Sin embargo, si el modelo de kriging simple incluye el error de medición, no se respetarán los valores de los datos de entrada (en la capa de kriging simple o en las realizaciones simuladas). Además de esto, se ha implementado la herramienta Simulaciones de estadísticas geográficas gaussianas para usar una vecindad de búsqueda continua (o suave) que evite discontinuidades en las superficies simuladas por cambios en la vecindad local utilizada en el kriging. Encontrará más detalles en Aldworth (1998) y en Gribov y Krivoruchko (2004).

Para obtener más información sobre conceptos de simulación de estadísticas geográficas y ejemplos de simulaciones condicionales y no condicionales, consulte la sección de ayuda sobre conceptos clave de la simulación de estadísticas geográficas.

Un flujo de trabajo general para la simulación de estadísticas geográficas gaussianas implica preparar los datos, crear las realizaciones, volver a transformar los resultados a las unidades originales y posprocesar los resultados o usar los resultados como entrada de una función de transferencia (modelo) para evaluar la variabilidad de la salida del modelo. Este proceso se ilustra en la siguiente figura:

Flujo de trabajo general de Simulación de estadísticas geográficas gaussianas.
Flujo de trabajo general de Simulación de estadísticas geográficas gaussianas

Comprobar la salida de la simulación

Se deben comprobar las realizaciones para confirmar lo siguiente:

  • Los valores de salida, sus patrones espaciales y las ubicaciones son razonables.
  • El histograma de los datos simulados reproduce, en promedio, el histograma de los datos de entrada.
  • Los semivariogramas de los datos simulados reproducen, en promedio, el semivariograma de los datos de entrada.
  • En el caso de la simulación condicional, se respetan los valores de los datos de entrada (a menos que el modelo de kriging simple incluya el error de medición).

Posprocesamiento

Una vez que se han producido las realizaciones, normalmente se posprocesan para obtener resúmenes de los resultados. La herramienta Simulaciones de estadísticas geográficas gaussianas permite varias opciones de posprocesamiento, las cuales se pueden realizar en toda la extensión espacial de los rásteres o en áreas de especial interés. Estas áreas se definen especificando una clase de entidad poligonal en la opción Polígonos estadísticos de entrada de la herramienta. La salida es similar en ambos casos: al posprocesar los rásteres completos se producen rásteres de resumen, mientras que al posprocesar en áreas poligonales se produce una clase de entidad poligonal de salida que contiene estadísticas de resumen de cada polígono.

Posprocesar toda la extensión del ráster

  • Los rásteres de salida incluyen el valor mínimo generado para cada ubicación (celda), así como el valor máximo, valor medio, desviación estándar, primer cuartil, mediana (segundo cuartil) y tercer cuartil. Además, puede especificar un cuantil que devolverá un valor correspondiente a ese cuantil basado en la distribución de valores simulados en cada celda. También puede especificar un valor de umbral, que devolverá el porcentaje de valores simulados que superan el umbral para cada celda.
  • Tenga en cuenta que la extensión que se va a posprocesar se puede limitar especificando un polígono de delimitación o un conjunto de puntos (en este caso, se genera una envoltura convexa que se utiliza como polígono de delimitación). Los valores solo se simulan dentro del polígono de delimitación.

Posprocesar áreas de interés

  • Cuando se especifican áreas de interés poligonales, la salida de cada polígono incluye automáticamente las estadísticas de resumen que se describen en la tabla siguiente. Además, puede especificar un valor cuantil y un valor de umbral (como al posprocesar toda la extensión del ráster). La salida que se genera cuando se seleccionan estas opciones también se describe en la tabla.
  • La salida de resumen de los polígonos se calcula utilizando operadores como los representados en la siguiente figura. El operador X utiliza todos los valores contenidos en el polígono y calcula un valor para cada realización. El operador Y usa valores de todas las realizaciones. Las entradas del operador Y son los valores de las áreas poligonales de cada realización calculados por el operador X.
Operadores para posprocesar áreas de interés.
Operadores para posprocesar áreas de interés

En la siguiente tabla se muestran los significados de los campos de la clase de entidad de salida.

Nombre de campoDescripción

MIN

Valor mínimo de cualquier celda de todas las realizaciones contenidas en el polígono.

MÁX

Valor máximo de cualquier celda de todas las realizaciones contenidas en el polígono.

MEAN

Valor medio de todas las celdas de todas las realizaciones contenidas en el polígono.

STDDEV

Desviación estándar de todas las celdas de todas las realizaciones contenidas en el polígono.

QUARTILE1

Valor del primer cuartil de todas las celdas de todas las realizaciones contenidas en el polígono.

MEDIAN

Valor de la mediana de todas las celdas de todas las realizaciones contenidas en el polígono.

QUARTILE3

Valor del tercer cuartil de todas las celdas de todas las realizaciones contenidas en el polígono.

QUANTILE

Valor correspondiente a un cuantil especificado por el usuario para todas las celdas de todas las realizaciones contenidas en el polígono.

P_THRSHLD

Porcentaje de celdas que superan un valor de umbral especificado por el usuario, basado en todas las celdas de todas las realizaciones contenidas en el polígono.

X_Y

La función X se aplica a los valores de las celdas contenidas en el polígono, realización por realización. Este proceso equivale a ejecutar la herramienta Estadísticas zonales usando el polígono como zona y una realización cada vez como cuadrícula de valores. La función Y se aplica a los valores producidos por la función X.

  • "X" puede ser una de las siguientes funciones: valor medio (MEAN), desviación estándar (STD), primer cuartil (Q1), mediana (MED), tercer cuartil (Q3), cuantil especificado por el usuario (Q) o un valor de umbral a superar especificado por el usuario (P).
  • "Y" puede ser una de las siguientes funciones: mínimo (MIN), máximo (MAX), valor medio (MEAN), desviación estándar (STD), primer cuartil (Q1), mediana (MED) o tercer cuartil (Q3).

CELL_COUNT

El número de celdas contenidas en el polígono. Si el centro de la celda se encuentra dentro del polígono, se considera que esa celda está en el polígono. Un recuento negativo indica que parte del polígono queda fuera de la extensión del ráster simulado o que parte del polígono queda fuera del límite de recorte. El número negativo indica el número total de celdas que se encuentran dentro del polígono.

SOURCE_ID

El Id. de objeto o entidad de la clase de entidad poligonal de entrada.

Campos de la clase de entidad poligonal de salida

Tanto para la opción de polígono de delimitación como para la opción de áreas de interés poligonales, se considera que las celdas ráster están dentro de los polígonos si el centro de la celda se encuentra dentro del límite del polígono.

Un ejemplo de simulación condicional y salida de posprocesamiento

La siguiente figura muestra los resultados de la simulación condicional con el posprocesamiento poligonal de la salida. Los mapas muestran el valor medio y la desviación estándar de 100 realizaciones de valores de ozono para cada condado de California. Estos valores medios y de desviación estándar se pueden utilizar, por ejemplo, en estudios epidemiológicos donde la incidencia de una enfermedad se debe comparar con el valor medio de ozono de cada condado.

Simulación condicional con salida poligonal.
Simulación condicional con salida poligonal

Referencias y bibliografía adicional

Aldworth, J. 1998. Spatial Prediction, Spatial Sampling, and Measurement Error. Ph.D. Thesis, Iowa State University. 186.

Chiles, J. P., y P. Delfiner. 1999. Geostatistics: Modeling Spatial Uncertainty. Nueva York: John Wiley & Sons, 449–471.

Deutsch, C. V., y A. G. Journel. 1998. GSLIB Geostatistical Software Library and User's Guide, 2.ª edición. Nueva York: Oxford University Press, 119–141.

Dietrich, C. R., y G. N. Newsam. 1993. "A Fast and Exact Method for Multidimensional Gaussian Stochastic Simulations." Water Resources Research 29 (8): 2861–2869.

Goodchild, M. F., B. O. Parks y L. T. Steyaert. 1993. Environmental Modeling with GIS. Nueva York: Oxford University Press, 432–437.

Gribov, A., y K. Krivoruchko. 2004. "Geostatistical Mapping with Continuous Moving Neighborhood." Mathematical Geology 36 (2): 267–281.

Journel, A. G. 1974. "Geostatistics for Conditional Simulation of Ore Bodies." Economic Geology 69: 673–687.

Leuangthong, O., J. A. McLennan y C. V. Deutsch. 2004. "Minimum Acceptance Criteria for Geostatistical Realizations." Natural Resources Research 13 (3): 131–141.