Fonctionnement des composantes principales

Disponible avec une licence Spatial Analyst.

L’outil Composantes principales permet de transformer les données des canaux en entrée de l’espace attributaire multivarié en entrée en un nouvel espace attributaire multivarié dont les axes pivotent par rapport à l’espace d’origine. Les axes (attributs) du nouvel espace ne sont pas corrélés. L’objectif principal de la transformation des données dans une analyse des composantes principales est de compresser les données en éliminant la redondance.

Un raster contenant une élévation, une pente et une exposition (sur une échelle continue) constitue un exemple de redondance de données évident. Puisque la pente et l’exposition sont généralement dérivées de l’élévation, la plus grande partie de la variance dans la zone d’étude peut simplement s’expliquer par l’élévation.

L’outil produit un raster multicanal présentant le même nombre de canaux que le nombre de composantes spécifié (un canal par axe ou composante dans le nouvel espace multivarié). La première composante principale présente la variance la plus importante, la seconde la deuxième variance la plus importante non décrite par la première, et ainsi de suite. Souvent, les trois ou quatre premiers rasters du raster multicanal résultat produit par l’outil Composantes principales décrira plus de 95 % de la variance. Les canaux rasters individuels restants peuvent être abandonnés. Puisque le nouveau raster multicanal contient moins de canaux et que plus de 95 % de la variance du raster multicanal d’origine sont intacts, les calculs seront plus rapides et la précision est conservée.

L’outil Composantes principales nécessite que les canaux en entrée soient identifiés, le nombre de composantes principales dans lesquelles transformer les données, le nom du fichier en sortie de statistiques, ainsi que le nom du raster en sortie. Le raster en sortie contiendra le même nombre de canaux que le nombre de composantes spécifié. Chaque canal décrira une composante.

Concepts de l’analyse des composantes principales

En principe, à l’aide d’un raster à deux bandes, le déplacement et la rotation des axes et la transformation des données s’effectuent comme suit :

  • Les données sont tracées dans un nuage de points.
  • Une ellipse est calculée pour relier les points dans le nuage de points (voir la figure ci-dessous).
    Limite de l’ellipse tracée
    Limite de l’ellipse tracée
  • L’axe majeur de l’ellipse est déterminé (voir la figure ci-dessous). L’axe majeur devient le nouvel axe x, la première composante principale (CP1). CP1 décrit la plus grande variation car elle constitue le transect le plus grand pouvant être dessiné à travers l’ellipse. La direction de CP1 est le vecteur propre et sa magnitude est la valeur propre. L’angle de l’axe x par rapport à CP1 est l’angle de rotation utilisé dans la transformation.
    Première composante principale
    Première composante principale
  • Une ligne orthogonale perpendiculaire à CP1 est calculée. Cette ligne constitue la deuxième composante principale (CP2) et le nouvel axe de l’axe y d’origine (voir la figure ci-dessous). Le nouvel axe décrit la plus grande variance non décrite par CP1.
    Deuxième composante principale
    Deuxième composante principale

À l’aide des vecteurs propres, des valeurs propres et de la matrice de covariance calculée de l’entrée du raster multicanal, une formule linéaire définissant le déplacement et la rotation est créée. Cette formule est appliquée pour transformer chaque valeur de cellule par rapport au nouvel axe.

Exemple

Voici un exemple du fichier de données en sortie créé pour trois composantes principales :

                    COVARIANCE MATRIX
#    Layer            1            2            3
#  -----------------------------------------------------------
1           34.1763      31.2377      51.8100
2           31.2377     212.6159      99.9540
3           51.8100      99.9540     118.8057
#  ===========================================================

#                    CORRELATION MATRIX
#    Layer            1            2            3
#  -----------------------------------------------------------
1            1.0000       0.3665       0.8131
2            0.3665       1.0000       0.6289
3            0.8131       0.6289       1.0000
#  ===========================================================

#               EIGENVALUES AND EIGENVECTORS
# Number of Input Layers     Number of Principal Component Layers
3                                3
# PC Layer            1            2            3
#  -----------------------------------------------------------
# Eigen Values
287.8278      69.8781       7.8920
# Eigen Vectors
# Input Layer
1            0.2112       0.4718       0.8560
2            0.8116      -0.5727       0.1154
3            0.5447       0.6704      -0.5039
#  ===========================================================

Bibliographie

Campbell, James B. Introduction to Remote Sensing. The Guilford Press. 1987.

Jensen, John R. Introductory Digital Image Processing: A Remote Sensing Perspective. Prentice–Hall. 1986.

Lillesand, Thomas M., and Ralph W. Kiefer. Remote Sensing and Image Processing. John Wiley and Sons. 1987.

Richards, John A. Remote Sensing Digital Image Analysis: An Introduction. Berlin: Springer–Verlag. 1986.

Rubriques connexes