Transformation du score normal

Disponible avec une licence Geostatistical Analyst.

Certaines méthodes d’interpolation et de simulation exigent que les données en entrée soient réparties normalement (voir Examiner la distribution de vos données pour une liste de ces méthodes). La transformation du score normal (TSN) est conçue pour transformer votre jeu de données afin qu’il ressemble fortement à une distribution normale standard. Pour ce faire, il classe les valeurs de votre jeu de données de la plus faible à la plus élevée et apparie ces classements à des classements équivalents générés à partir d’une distribution normale. Les étapes de la transformation sont les suivantes : votre jeu de données est trié et classé, un classement équivalent issu d’une distribution normale standard est trouvé pour chaque classement de votre jeu de données et les valeurs de distribution normale associées à ces classements constituent le jeu de données transformées. Le processus de classement peut s’effectuer à l’aide de la distribution de fréquence ou de la distribution cumulative des jeux de données.

Des exemples illustrant des histogrammes et des distributions cumulatives avant et après l’application d’une transformation du score normal sont présentés ci-dessous :

Histogrammes avant et après la transformation du score normal
Histogrammes avant et après la transformation du score normal

Distributions cumulatives avant et après la transformation du score normal
Distributions cumulatives avant et après la transformation du score normal

Méthodes d’approximation

In Geostatistical Analyst, il existe quatre méthodes d’approximation : directe, linéaire, noyaux gaussiens et coefficient multiplicatif correctif. La méthode directe utilise la distribution cumulative observée, la méthode linéaire ajuste les lignes entre chaque étape de la distribution cumulative et la méthode par noyaux gaussiens estime la distribution cumulative en ajustant une combinaison linéaire de distributions normales cumulatives de composants. Le coefficient multiplicatif correctif estime la distribution cumulative en ajustant une distribution de base (t de Student, logarithmique normale, gamma, empirique et logarithmique empirique) qui est ensuite corrigée par une combinaison linéaire de distributions bêta (la correction est réalisée avec la transformation intégrale de la probabilité inverse). Les distributions de base Logarithmique normale, Gamma et Logarithmique empirique peuvent uniquement être utilisées pour les données positives, et les prévisions sont assurées d’être positives. Le critère d’information d’Akaike (AIC) est fourni pour évaluer la qualité du modèle ajusté.

Une fois les prévisions réalisées sur l’échelle transformée, le logiciel rétablit automatiquement les prévisions à l’échelle d’origine. Le choix de la méthode d’approximation dépend des hypothèses que vous êtes prêt à formuler et du lissage de l’approximation. La méthode directe est la moins lisse et comporte le moins grand nombre d’hypothèses. La méthode linéaire est intermédiaire. Les méthodes par noyaux gaussiens et coefficient multiplicatif correctif présentent des transformations inverses lisses, mais supposent que la distribution des données peut être estimée par une combinaison finie de distributions connues.

Rubriques connexes


Dans cette rubrique
  1. Méthodes d’approximation