Disponible avec une licence Geostatistical Analyst.
Pour supprimer une tendance de surface de vos données et utiliser le krigeage ou le cokrigeage sur les données décomposées (résiduelles), considérez le modèle additif suivant :
Z(s) = µ(s) + ε(s),
où µ(s) est une surface déterministe (tendance) et ε(s) est une erreur spatialement auto-corrélée.
En théorie, la tendance est fixe. Autrement dit, la tendance ne change jamais quel que soit le nombre de fois où vous simulez les données. Vous observez toutefois des fluctuations dans les surfaces simulées en raison des erreurs aléatoires auto-corrélées. La tendance évolue généralement graduellement dans l’espace, tandis que les erreurs aléatoires changent plus rapidement. Un exemple météorologique de tendance serait l’observation (et la connaissance théorique) d’un gradient de température avec la latitude. Toutefois, les observations effectuées n’importe quel jour montrent des variations locales en raison des fronts météorologiques, de la couverture terrestre, des modèles nuageux, etc. qui ne sont pas prévisibles ; les variations locales sont donc modélisées comme étant auto-corrélées.
Malheureusement, il n’existe pas de méthode parfaite qui permette de décomposer les données exclusivement en une tendance et des erreurs aléatoires. Vous pouvez vous aider des indications ci-après.
Dans le graphique de décomposition suivant, les données ont été simulées à partir de deux modèles. Un jeu de données est issu du modèle de krigeage ordinaire, où Z(s) = µ + ε(s) et les erreurs ont été auto-corrélées. Le traitement a une moyenne µ = 0 avec un semi-variogramme exponentiel. Un autre jeu de données a été simulé à partir du modèle de krigeage universel avec µ(s) = ß0 + ß1x(s) + ß2x2(s), représenté par la ligne pleine, mais les erreurs étaient indépendantes avec une moyenne de 0 et une variance de 1.
Il est difficile de différencier les modèles (les cercles bleus proviennent du modèle de krigeage ordinaire, et les cercles rouges du modèle de krigeage universel avec des erreurs indépendantes). L’autocorrélation spatiale admet des surfaces de prévision flexibles et cet exemple montre qu’il est parfois difficile de choisir un modèle parmi les modèles qui reposent uniquement sur les données. En règle générale, vous devez utiliser le krigeage ordinaire sauf si vous avez de bonnes raisons de supprimer une surface de tendance. Il est en effet préférable que les modèles soient aussi simples que possible. Si vous supprimez une surface de tendance, davantage de paramètres doivent être estimés. Une surface quadratique bidimensionnelle ajoute cinq paramètres en plus du paramètre d’interception qui doit être estimé. Plus le nombre de paramètres à estimer est élevé, moins les modèles sont précis.
Il peut cependant arriver que les coordonnées spatiales indiquent une tendance connue des données. Par exemple, la production agricole est susceptible d’évoluer avec la latitude, non à cause des coordonnées elles-mêmes, mais parce que la température, l’humidité, les précipitations, etc. changent avec la latitude. Dans ce cas, il peut être pertinent de supprimer les surfaces de tendance. À nouveau, gardez les surfaces aussi simples que possible, avec des polynômes de premier ou de second ordre.
Il existe un risque de surajustement des données lorsque vous utilisez des tendances et que vous laissez trop peu de variation dans les valeurs résiduelles pour tenir correctement compte de l’incertitude de la prévision. Vérifiez toujours les modèles par validation croisée ou par validation lorsque vous utilisez des modèles de tendance.
Vous pouvez également utiliser l’outil Tendance directionnelle pour visualiser la tendance selon différentes directions de manière à déterminer un modèle de suppression des tendances approprié. Faites des essais avec différentes directions et différents ordres polynomiaux pour observer l’évolution de la tendance en fonction des directions.
En savoir plus sur les transformations et les tendances
Vous avez un commentaire à formuler concernant cette rubrique ?