Fonctionnement de l’outil Simulations géostatistiques gaussiennes

Disponible avec une licence Geostatistical Analyst.

Mode de génération des réalisations

L’outil Simulations géostatistiques gaussiennes fonctionne en créant d’abord une grille de valeurs attribuées de façon aléatoire dessinées à partir d’une distribution normale standard (moyenne = 0 et variance = 1). Le modèle de covariance (issu du semi-variogramme spécifié dans la couche de krigeage simple, qui est nécessaire en entrée pour la simulation) est ensuite appliqué au raster. Les valeurs raster sont ainsi conformes à la structure spatiale présente dans le jeu de données en entrée. Le raster généré constitue une réalisation non conditionnelle. De nombreux autres peuvent être produits chaque fois à l’aide d’un raster différent de valeurs distribuées normalement. Cette méthode est expliquée en détail dans Dietrich and Newsam (1993).

Si la simulation conditionnelle a été sélectionnée, les rasters non conditionnels sont conditionnés via le krigeage. Ce processus utilise l’estimation avec krigeage (prévision) à chaque localisation pour vérifier que les valeurs simulées respectent les valeurs de données en entrée et que, en moyenne, les prévisions avec krigeage sont répliquées. Le conditionnement des réalisations avec le krigeage est expliqué en détail dans Journel (1974).

Cependant, si le modèle de krigeage simple inclut une erreur de mesure, les valeurs de données en entrée ne sont pas respectées (dans la couche de krigeage simple ou dans les réalisations simulées). En outre, l’outil Simulations géostatistiques gaussiennes a été développé de façon à utiliser un voisinage de recherche continu (ou lisse) qui évite les interruptions dans les surfaces simulées en raison de modifications dans le voisinage local utilisé dans le krigeage. Pour plus d’informations, reportez-vous à Aldworth (1998) et Gribov et Krivoruchko (2004).

Pour en savoir plus sur les concepts de simulation géostatistique et pour des exemples de simulation conditionnelle et non conditionnelle, consultez la section d’aide sur les concepts clés de la simulation géostatistique.

Le processus général de simulation géostatistique gaussienne implique la préparation des données, la création des réalisations, la retransformation des résultats dans les unités d’origine et le post-traitement des résultats et/ou l’utilisation des résultats en entrée dans une fonction de transfert (modèle) pour évaluer la variabilité dans la sortie du modèle. Ce processus est représenté dans la figure suivante :

Processus général de simulation géostatistique gaussienne.
Processus général de simulation géostatistique gaussienne

Vérification du résultat de simulation

Les réalisations doivent être vérifiées pour confirmer ce qui suit :

  • Les valeurs en sortie, leurs modèles spatiaux et les localisations sont raisonnables.
  • L’histogramme des données simulées reproduit l’histogramme des données en entrée, en moyenne.
  • Les semi-variogrammes des données simulées reproduisent le semi-variogramme des données en entrée, en moyenne.
  • Pour la simulation conditionnelle, les valeurs de données en entrée sont respectées (sauf si le modèle de krigeage simple inclut une erreur de mesure).

Post-traitement

Une fois les réalisations produites, elles sont généralement post-traitées pour obtenir des résumés des résultats. L’outil Simulations géostatistiques gaussiennes autorise plusieurs options de post-traitement, qui peuvent être appliquées à l’ensemble de l’étendue spatiale des rasters ou à des zones d’intérêt particulier. Ces zones sont définies en spécifiant une classe d’entités surfaciques dans l’option Polygones statistiques en entrée de l’outil. La sortie est similaire dans les deux cas : le post-traitement de l’ensemble des rasters produit des rasters résumés, tandis que le post-traitement sur des zones polygonales produit une classe d’entités surfaciques en sortie qui contient des résumés statistiques pour chaque polygone.

Post-traitement de l’étendue raster entière

  • Les rasters en sortie incluent la valeur minimale générée pour chaque localisation (cellule), ainsi que la valeur maximale, la moyenne, l’écart type, le premier quartile, la médiane (deuxième quartile) et le troisième quartile. Vous pouvez en outre spécifier un quantile qui renverra une valeur correspondant à ce quantile, en fonction de la distribution des valeurs simulées à chaque cellule. Vous pouvez également spécifier une valeur de seuil, qui renverra le pourcentage de valeurs simulées qui dépassent le seuil pour chaque cellule.
  • Notez qu’il est possible de limiter l’étendue à post-traiter en spécifiant un polygone d’emprise ou un ensemble de points (dans ce cas, une enveloppe convexe est générée et utilisée comme polygone d’emprise). Les valeurs sont uniquement simulées dans le polygone d’emprise.

Post-traitement pour les zones d’intérêt

  • Lorsque des zones d’intérêt surfaciques sont spécifiées, la sortie de chaque polygone inclut automatiquement les résumés statistiques décrits dans la table ci-dessous. Vous pouvez en outre spécifier une valeur de quantile et une valeur de seuil (comme lors du post-traitement de l’ensemble de l’étendue raster). La sortie générée lorsque ces options sont sélectionnées est également décrite dans la table.
  • La sortie récapitulative pour les polygones est calculée avec des opérateurs tels que ceux représentés dans la figure ci-dessous. L’opérateur X utilise toutes les valeurs comprises dans le polygone et calcule une valeur pour chaque réalisation. L’opérateur Y utilise les valeurs de toutes les réalisations. Les entrées de l’opérateur Y sont les valeurs des zones polygonales de chaque réalisation, calculées par l’opérateur X.
Opérateurs de post-traitement des zones d’intérêt.
Opérateurs de post-traitement des zones d’intérêt

La signification des champs dans la classe d’entités en sortie est indiquée dans la table suivante.

Nom du champDescription

MIN

Valeur minimale d’une cellule dans toutes les réalisations à l’intérieur du polygone.

MAX

Valeur maximale d’une cellule dans toutes les réalisations à l’intérieur du polygone.

MOYENNE

Moyenne de toutes les cellules dans toutes les réalisations à l’intérieur du polygone.

STDDEV

Écart type de toutes les cellules dans toutes les réalisations à l’intérieur du polygone.

QUARTILE1

Valeur de premier quartile de toutes les cellules dans toutes les réalisations à l’intérieur du polygone.

MEDIANE

Valeur médiane de toutes les cellules dans toutes les réalisations à l’intérieur du polygone.

QUARTILE3

Valeur de troisième quartile de toutes les cellules dans toutes les réalisations à l’intérieur du polygone.

QUANTILE

Valeur correspondant à un quantile spécifié par l’utilisateur pour toutes les cellules dans toutes les réalisations à l’intérieur du polygone.

P_THRSHLD

Pourcentage de cellules supérieur à une valeur de seuil spécifiée par l’utilisateur, basé sur toutes les cellules dans toutes les réalisations à l’intérieur du polygone.

X_Y

La fonction X est appliquée aux valeurs des cellules à l’intérieur du polygone, une réalisation à la fois. Ce processus équivaut à exécuter l’outil Statistiques zonales à l’aide du polygone en tant que zone et une réalisation à la fois comme grille de valeur. La fonction Y est appliquée aux valeurs produites par la fonction X.

  • X peut être l’une des fonctions suivantes : moyenne (MEAN), écart type (STD), premier quartile (Q1), médiane (MED), troisième quartile (Q3), quantile spécifié par l’utilisateur (Q) ou une valeur de seuil spécifiée par l’utilisateur à dépasser (P).
  • XY peut être l’une des fonctions suivantes : valeur minimale (MIN), valeur maximale (MAX), moyenne (MEAN), écart type (STD), premier quartile (Q1), médiane (MED) ou troisième quartile (Q3).

CELL_COUNT

Nombre de cellules comprises dans le polygone. Si le centre de cellule se situe à l’intérieur du polygone, cette cellule est censée être dans le polygone. Un nombre négatif indique qu’une partie du polygone se trouve à l’extérieur de l’étendue du raster simulé et/ou qu’une partie du polygone se trouve en dehors de la limite de découpage. Le nombre négatif même indique le nombre total de cellules comprises dans le polygone.

SOURCE_ID

ID d’objet ou d’entité de la classe d’entités surfaciques en entrée.

Champs dans la classe d’entités surfaciques en sortie

Pour les deux options de polygone d’emprise et de zones d’intérêt surfaciques, les cellules raster sont censées se trouver à l’intérieur des polygones si le centre se trouve dans les limites du polygone.

Exemple de simulation conditionnelle et de sortie de post-traitement

La figure suivante montre les résultats d’une simulation conditionnelle avec le post-traitement surfacique de la sortie. Les cartes présentent la moyenne et l’écart type de 100 réalisations des valeurs d’ozone pour chaque comté de Californie. Ces valeurs de moyenne et d’écart type peuvent être utilisées, par exemple, dans des études épidémiologiques où l’apparition d’une maladie doit être comparée à la valeur d’ozone moyenne pour chaque comté.

Simulation conditionnelle avec sortie surfacique.
Simulation conditionnelle avec sortie surfacique

Références et lectures complémentaires

Aldworth, J. 1998. Spatial Prediction, Spatial Sampling, and Measurement Error. Ph.D. Thesis, Iowa State University. 186.

Chiles, J. P., and P. Delfiner. 1999. Geostatistics: Modeling Spatial Uncertainty. New York: John Wiley & Sons, 449–471.

Deutsch, C. V., and A. G. Journel. 1998. GSLIB Geostatistical Software Library and User's Guide, 2nd edition. New York: Oxford University Press, 119–141.

Dietrich, C. R., and G. N. Newsam. 1993. « A Fast and Exact Method for Multidimensional Gaussian Stochastic Simulations. » Water Resources Research 29 (8): 2861–2869.

Goodchild, M. F., B. O. Parks, and L. T. Steyaert. 1993. Environmental Modeling with GIS. New York: Oxford University Press, 432–437.

Gribov, A., and K. Krivoruchko. 2004. « Geostatistical Mapping with Continuous Moving Neighborhood. » Mathematical Geology 36 (2): 267–281.

Journel, A. G. 1974. « Geostatistics for Conditional Simulation of Ore Bodies. » Economic Geology 69: 673–687.

Leuangthong, O., J. A. McLennan, and C. V. Deutsch. 2004. « Minimum Acceptance Criteria for Geostatistical Realizations. » Natural Resources Research 13 (3): 131–141.