Transformations Box-Cox, de l’arc sinus et logarithmique

Disponible avec une licence Geostatistical Analyst.

Dans Geostatistical Analyst, certaines méthodes exigent que les données soient distribuées normalement. Lorsque les données sont inclinées (la distribution est déséquilibrée), vous pouvez souhaiter transformer les données afin de les normaliser. L’histogramme vous permet de découvrir les effets de différentes transformations sur la distribution du jeu de données. Si le modèle d’interpolation que vous créez utilise l’une des méthodes de krigeage et que vous choisissez de transformer les données dans l’une des étapes, les prévisions retrouveront l’échelle d’origine dans la surface interpolée.

Geostatistical Analyst permet d’utiliser plusieurs transformations dont Box-Cox (également nommées transformations de puissance), de l’arc sinus et logarithmique. Supposons que vous observez les données Z(s) et appliquez une transformation Y(s) = t(Z(s)). En règle générale, vous voulez trouver la transformation qui fait en sorte que Y(s) soit normalement distribuée. Ce qui se produit souvent, c’est que la transformation génère également des données dont la variance est constante à travers la zone d’étude.

En savoir plus sur les transformations et les tendances

Transformation Box-Cox

La transformation Box-Cox est

Y(s) = (Z(s)λ - 1)/λ,

pour λ≠ 0.

Supposons par exemple que vos données se composent des totaux de certains phénomènes. Pour ces types de données, la variance est souvent associée à la moyenne. En d’autres termes, si vous avez de petits totaux dans une partie de votre zone d’étude, la variabilité dans cette région locale sera inférieure à la variabilité dans une autre région où les totaux sont plus importants. Dans ce cas, la transformation de racine carrée peut faciliter l’établissement de variances plus constantes dans toute la zone d’étude, ce qui souvent donne l’impression que les données sont normalement distribuées également. La transformation de racine carrée est un cas spécial de la transformation Box-Cox lorsque λ = ½.

Transformation logarithmique

La transformation logarithmique est en réalité un cas spécial de la transformation Box-Cox lorsque λ = 0. La transformation est la suivante :

Y(s) = ln(Z(s)),

pour Z(s) > 0, et ln est le logarithme naturel.

La transformation logarithmique est souvent utilisée lorsque les données ont une distribution positivement asymétrique (illustration ci-dessous) et que les valeurs importantes sont peu nombreuses. Si ces valeurs importantes se trouvent dans votre zone d’étude, la transformation logarithmique facilite l’établissement de variances plus constantes et normalise les données. Concernant la terminologie, lorsqu’une transformation logarithmique est implémentée avec krigeage, la méthode de prévision est connue sous le nom de krigeage de logarithmique normale, tandis que pour toutes les autres valeurs de λ, la méthode de krigeage associée est connue sous le nom de krigeage trans-gaussien.

Distribution positivement asymétrique

Transformation de l’arc sinus

La transformation de l’arc sinus est illustrée ci-dessous :

Y(s) = sin-1(Z(s)),

pour Z(s) entre 0 et 1.

La transformation de l’arc sinus peut servir pour les données qui représentent des proportions ou des pourcentages. Lorsque les données sont des proportions, la variance est souvent la plus basse près de 0 et 1 et la plus importante près de 0,5. La transformation de l’arc sinus facilite l’établissement de variances plus constantes dans toute la zone d’étude et donne souvent l’impression que les données sont normalement distribuées également.

Rubriques connexes