Vocabulaire essentiel de Geostatistical Analyst

Disponible avec une licence Geostatistical Analyst.

Les termes et concepts suivants se rencontrent fréquemment en géostatistique et dans Geostatistical Analyst.

PériodeDescription

Validation croisée

Technique utilisée pour évaluer la précision d’un modèle d’interpolation. Dans Geostatistical Analyst, la validation croisée laisse un point de côté et utilise le reste pour prévoir une valeur à cette localisation. Le point est ensuite réintégré dans le jeu de données et un autre point est retiré. Cette opération est réalisée pour tous les échantillons du jeu de données. Elle fournit des paires de valeurs prévues et connues qui peuvent être comparées pour évaluer les performances du modèle. Les résultats sont généralement synthétisés sous forme d’erreurs quadratique moyenne et de racines carrées de l’erreur quadratique moyenne.

Méthodes déterministes

Dans Geostatistical Analyst, les méthodes déterministes créent des surfaces à partir de points mesurés, en fonction d’une étendue de similitude (pondération par l’inverse de la distance, par exemple) ou d’un degré de lissage (fonctions de base radiale, par exemple). Elles ne fournissent pas de mesure d’incertitude (erreur) des prévisions.

Couche géostatistique

Les résultats produits par de nombreux outils de géotraitement dans la boîte à outils Geostatistical Analyst sont stockés dans une surface nommée couche géostatistique. Les couches géostatistiques peuvent être utilisées pour générer des cartes des résultats, afficher et réviser les valeurs de paramètre de la méthode d’interpolation, créer d’autres types de couches géostatistiques (cartes d’erreurs de prévision, par exemple) et exporter les résultats aux formats raster et vectoriel (isoligne, isoligne remplie et points).

Méthodes géostatistiques

Dans Geostatistical Analyst, les méthodes géostatistiques reposent sur des modèles statistiques qui comprennent l’autocorrélation (relation statistique parmi les points mesurés). Ces techniques ont la capacité de produire une surface de prévision, ainsi que des mesures de l’incertitude (erreur) associée à ces prévisions.

Interpolation

Traitement qui recourt aux valeurs mesurées prises à des localisations d’échantillonnage connues pour prévoir (estimer) les valeurs de localisations non échantillonnées. Geostatistical Analyst propose plusieurs méthodes d’interpolation, qui diffèrent selon leur hypothèse sous-jacente, critères de données et capacités à générer différents types de sortie (prévoir les valeurs ainsi que les erreurs [incertitudes] associées, par exemple).

Noyau

Fonction de pondération utilisée dans plusieurs méthodes d’interpolation proposées dans Geostatistical Analyst. De manière générale, les pondérations plus élevées sont attribuées aux valeurs d’échantillonnage proches de la localisation où une prévision est réalisée. Les pondérations moins élevées sont quant à elles attribuées aux valeurs d’échantillonnage plus éloignées.

Krigeage

Collection de méthodes d’interpolation qui reposent sur des modèles de semi-variogramme d’autocorrélation spatiale pour générer des valeurs prévues, des erreurs associées aux prévisions et d’autres informations concernant la distribution des valeurs potentielles pour chaque localisation dans la zone d’étude (via les cartes de quantiles et des probabilités ou via la simulation géostatistique, qui fournit un ensemble de valeurs potentielles pour chaque localisation).

Search neighborhood

La plupart des méthodes d’interpolation utilisent un sous-ensemble local des données pour effectuer des prévisions. Imaginez une fenêtre mobile : seules les données à l’intérieur de la fenêtre sont utilisées pour effectuer une prévision au centre de la fenêtre. Cette opération a lieu pour deux raisons : parce que des informations redondantes figurent dans les échantillons éloignés de la localisation où nous devons effectuer une prévision et pour accélérer le temps de calcul requis afin de générer la valeur prévue pour l’ensemble de la zone d’étude. Le choix du voisinage (nombre d’échantillons à proximité et leur configuration spatiale dans la fenêtre) affecte la surface de prévision et doit être effectué avec précaution.

Semi-variogramme

Fonction qui décrit les différences (variance) entre des échantillons séparés par des distances variables. En règle générale, le semi-variogramme présente une variance faible pour les petites différences et des variances plus importantes lorsque les distances de séparation sont supérieures, ce qui indique que les données sont autocorrélées spatialement. Les semi-variogrammes estimés à partir de données d’échantillonnage sont des semi-variogrammes empiriques. Ils sont représentés sous forme d’un ensemble de points sur un diagramme. Une fonction est ajustée selon ces points, connue sous le nom de modèle de semi-variogramme. Le modèle de semi-variogramme est un composant clé du krigeage (méthode d’interpolation puissante qui peut fournir des valeurs prévues, des erreurs associées aux prévisions et des informations sur la distribution des valeurs potentielles pour chaque localisation dans la zone d’étude).

Simulation

En géostatistique, ce terme désigne une technique qui étend le krigeage en produisant différentes versions possibles d’une surface prévue (par opposition au krigeage, qui ne génère qu’une surface). L’ensemble des surfaces prévues offre diverses informations qui peuvent servir à décrire l’incertitude d’une valeur prévue pour une localisation en particulier, l’incertitude d’un ensemble de valeurs prévues dans une zone d’intérêt ou un ensemble de valeurs prévues pouvant être utilisées en entrée dans un deuxième modèle (physique, économique, etc) pour évaluer les risques et améliorer la prise de décision.

Auto-corrélation spatiale

Les phénomènes naturels présentent souvent une autocorrélation spatiale, c’est-à-dire que les valeurs d’échantillonnage prélevées à proximité les unes des autres se ressemblent davantage que les échantillons éloignés les uns des autres. Certaines méthodes d’interpolation requièrent un modèle explicite d’autocorrélation spatiale (le krigeage, par exemple), d’autres reposent sur des degrés supposés d’autocorrélation spatiale sans fournir aucun moyen pour les mesurer (la pondération par l’inverse de la distance, par exemple) et d’autres encore ne nécessitent aucune notion de l’autocorrélation spatiale dans le jeu de données. Notez qu’en cas d’autocorrélation spatiale, les méthodes statistiques traditionnelles (qui reposent sur l’indépendance parmi les observations) ne peuvent pas être utilisées efficacement.

Transformation

Une transformation de données s’effectue lorsqu’une fonction (logarithmique, Box-Cox, arc sinus et score normal) est appliquée aux données pour modifier la forme de sa distribution et/ou stabiliser la variance (réduire la relation entre la moyenne et la variance, par exemple l’augmentation de la variabilité des données avec la valeur moyenne).

Validation

Identique à la validation croisée, mais au lieu d’utiliser le même jeu de données pour créer et évaluer le modèle, deux jeux de données sont utilisés : un pour créer le modèle et l’autre pour tester les performances de façon indépendante. Si un seul jeu de données est disponible, vous pouvez utiliser l’outil Sous-ensembles d’entités pour le fractionner aléatoirement en sous-ensembles d’entraînement et de test.

Vocabulaire essentiel de Geostatistical Analyst