Procédure de suppression des tendances à partir des données

Disponible avec une licence Geostatistical Analyst.

Vous souhaitez peut-être supprimer une tendance de surface des données et utiliser le krigeage ou le cokrigeage sur les données décomposées (résiduelles). Considérez le modèle additif suivant :

Z(s) = µ(s) + ε(s),

µ(s) est une surface déterministe (tendance) et ε(s) est une erreur spatialement auto-corrélée.

Conceptuellement, la tendance est fixe, ce qui signifie que si vous simulez les données encore et encore, la tendance ne change jamais. Vous observez cependant des fluctuations dans la surface simulée en raison des erreurs aléatoires auto-corrélées. La tendance évolue généralement graduellement dans l’espace, tandis que les erreurs aléatoires changent plus rapidement. Un exemple météorologique de tendance serait l’observation (et la connaissance théorique) d’un gradient de température avec la latitude. Toutefois, les observations effectuées n’importe quel jour montrent des variations locales en raison des fronts météorologiques, de la couverture terrestre, des modèles nuageux, etc. qui ne sont pas prévisibles ; les variations locales sont donc modélisées comme étant auto-corrélées.

Il n’existe malheureusement pas de formule magique pour décomposer les données exclusivement en une tendance et des erreurs aléatoires. Vous pouvez vous aider des indications ci-après.

Dans le graphique de décomposition suivant, les données ont été simulées à partir de deux modèles. Un jeu de données est issu du modèle de krigeage ordinaire, où Z(s) = µ + ε(s) et les erreurs e(s) ont été auto-corrélées. Le traitement a une moyenne µ = 0 avec un semi-variogramme exponentiel. Un autre jeu de données a été simulé à partir du modèle de krigeage universel avec µ(s) = ß0 + ß1x(s) + ß2x2(s), représenté par la ligne pleine, mais les erreurs étaient indépendantes avec une moyenne de 0 et une variance de 1.

Graphique de décomposition

Il est difficile de les distinguer (les cercles bleus proviennent du modèle de krigeage ordinaire et les cercles rouges du modèle de krigeage universel avec des erreurs indépendantes). L’autocorrélation spatiale admet des surfaces de prévision flexibles et cet exemple montre qu’il est parfois difficile de choisir un modèle parmi les modèles qui reposent uniquement sur les données. En règle générale, il est conseillé de suivre le plus possible le krigeage ordinaire sauf si vous avez de bonnes raisons de supprimer une surface de tendance. Il est en effet préférable que les modèles soient aussi simples que possible. Si vous supprimez une surface de tendance, davantage de paramètres doivent être estimés. Une surface quadratique bidimensionnelle ajoute cinq paramètres en plus du paramètre d’interception qui doit être estimé. Plus le nombre de paramètres à estimer est élevé, moins les modèles sont précis.

Il peut cependant arriver que les coordonnées spatiales indiquent une tendance connue des données. Par exemple, la production agricole est susceptible d’évoluer avec la latitude, non à cause des coordonnées elles-mêmes, mais parce que la température, l’humidité, les précipitations, etc. changent avec la latitude. Dans ce cas, il peut s’avérer utile de supprimer les surfaces de tendance. À nouveau, gardez les surfaces aussi simples que possible, avec des polynômes de premier ou de second ordre.

Il existe un risque réel de surajustement des données lorsque vous utilisez des tendances et que vous laissez trop peu de variation dans les valeurs résiduelles pour tenir correctement compte de l’incertitude de la prévision. Veillez à vérifier les modèles à l’aide de la validation croisée et surtout de la validation lorsque vous utilisez des modèles de tendance.

En savoir plus sur les transformations et les tendances