Quels sont les différents modèles de krigeage ?

Disponible avec une licence Geostatistical Analyst.

Les méthodes de krigeage dépendent des modèles mathématiques et statistiques. L’ajout d’un modèle statistique qui inclut la probabilité distingue les méthodes de krigeage des méthodes déterministes décrites dans la rubrique Méthodes déterministes pour l’interpolation spatiale. Dans le cas du krigeage, vous associez une certaine probabilité à des prévisions ; cela signifie que les valeurs ne sont pas parfaitement prévisibles à partir d’un modèle statistique. Prenez l’exemple d’un échantillon de valeurs mesurées d’azote dans un champ. Il est évident que même avec un large échantillon, vous ne pouvez pas prévoir la valeur exacte d’azote à une certaine localisation non mesurée. Vous essayez donc non seulement de la prévoir, mais aussi d’évaluer l’erreur de la prévision.

Les méthodes de krigeage reposent sur la notion d’auto-corrélation. On considère souvent la corrélation comme la tendance de la relation entre deux types de variables. Par exemple, la bourse tend à changer positivement lorsque les taux d’intérêt sont bas ; on dit alors qu’ils sont négativement corrélés. Toutefois, la bourse est positivement auto-corrélée, c’est-à-dire qu’elle possède une corrélation en elle-même. En bourse, deux valeurs tendent à être davantage similaires si elles ne sont séparées que d’une journée et non d’une année entière. Il s’agit d’un principe de base de la géographie : les choses proches ont tendance à être davantage similaires que celles qui sont plus éloignées les unes des autres. Le taux d’effritement de la corrélation peut être exprimé en fonction de la distance.

L’auto-corrélation est fonction de la distance. Il s’agit d’un principe de base des géostatistiques. Dans le cas de statistiques classiques, les observations sont supposées être indépendantes, c’est-à-dire qu’il n’existe pas de corrélation entre les observations. Dans le cas de géostatistiques, les informations sur les localisations spatiales vous permettent de calculer des distances entre les observations et de modéliser l’auto-corrélation en tant que fonction de la distance.

Notez qu’en général, la bourse part à la hausse avec le temps, ce qui est exprimé par le terme tendance. Dans le cas de données géostatistiques, vous avez les mêmes termes, exprimés dans la formule mathématique simple suivante :

Z(s) = µ(s) + ε(s),

où Z(s) est la variable d’intérêt, décomposée en une tendance déterministe µ(s) et une forme d’erreurs auto-corrélées aléatoires ε(s). Le symbole s indique simplement la localisation ; considérez-le comme s’il contenait les coordonnées spatiales x (longitude) et y (latitude). Les variations de cette formule constituent la base de tous les différents types de krigeage. Commencez à droite et déplacez-vous vers la gauche.

Quelle que soit la complexité de la tendance dans le modèle, µ(s) ne génère pas une prévision parfaite. Dans ce cas, certaines hypothèses concernant le terme d’erreur ε(s) sont faites ; en effet, elles devraient être égales à 0 (en moyenne) et l’auto-corrélation entre ε(s) et ε(s + h) ne devrait pas dépendre de la localisation réelle s, mais uniquement du déplacement h entre les deux. Cela est nécessaire pour garantir la réplication qui vous permet d’estimer la fonction d’auto-corrélation. Par exemple, dans la figure suivante :

Flèches d’auto-corrélation

Les erreurs aléatoires aux paires de localisations connectées par les flèches sont supposées avoir la même auto-corrélation.

Examinez ensuite la tendance. Il peut s’agir d’une constante simple, à savoir, µ(s) = m pour toutes les localisations s, et si µ est inconnu, il s’agit du modèle sur lequel repose le krigeage ordinaire. Elle peut également être composée d’une fonction linéaire des coordonnées spatiales elles-mêmes, par exemple :

µ(s) = ß0 + ß1x + ß2y + ß3x2 + ß4y2 + ß5xy,

où il s’agit d’une surface de tendance polynomiale de second ordre et juste de la régression linéaire sur les coordonnées spatiales x et y. Les tendances qui varient et où les coefficients de régression sont inconnus constituent les modèles du krigeage universel. Lorsque la tendance est complètement connue (c’est-à-dire que tous les paramètres et covariables sont connus), qu’elle soit constante ou non, elle constitue le modèle du krigeage simple.

Examinez maintenant le côté gauche de la décomposition, Z(s) = µ(s) + ε(s). Vous pouvez procéder à des transformations sur Z(s). Vous pouvez, par exemple, le modifier en une variable indicatrice, égale à 0 si Z(s) est inférieur à une certaine valeur (par exemple, 0,12 ppm pour la concentration d’ozone) ou 1 s’il est supérieur à une certaine valeur. Vous pouvez prévoir la probabilité que Z(s) soit supérieur à la valeur de seuil ; les prévisions basées sur ce modèle forment alors le krigeage d’indicatrices. Vous pouvez effectuer des transformations générales non spécifiées de Z(s) et les appeler fi(Z(si)) pour la ième variable. Vous pouvez former des prédicteurs de fonctions de variables ; pafr exemple, si vous souhaitez effectuer des prévisions à la localisation s0, vous formez le prédicteur de krigeage disjonctif g(Z(s0)) avec les données fi(Z(si)).

Finalement, prenez le cas où vous avez plusieurs types de variables et que vous formez les modèles Zj(s) = µj(s) + εj(s) pour le jème type de variable. Ici, vous pouvez considérer une tendance différente pour chaque variable, et au-delà de l’auto-corrélation pour les erreurs εj(s), vous avez également la corrélation croisée entre les erreurs εj(s) et εk(s) pour les deux types de variables. Vous pouvez, par exemple, considérer la corrélation croisée entre deux variables telles que la concentration d’ozone et les particules en suspension qui ne doivent pas être mesurées aux mêmes localisations. Les modèles basés sur plusieurs variables d’intérêt constituent la base du cokrigeage. Vous pouvez former une variable indicatrice de Z(s), et si vous la prévoyez en utilisant les données non transformées d’origine Z(s) dans un modèle de cokrigeage, vous obtenez un krigeage de probabilités. Si vous disposez de plusieurs variables d’intérêt, vous pouvez considérer le cokrigeage ordinaire, le cokrigeage universel, le cokrigeage simple, le cokrigeage d’indicatrices, le cokrigeage de probabilités et le cokrigeage disjonctif comme des extensions multivariées des différents types de krigeage décrits précédemment.