Cómo funciona Componentes principales

Disponible con una licencia de Spatial Analyst.

La herramienta Componentes principales se utiliza para transformar los datos de las bandas de entrada del espacio de atributos multivariante de entrada a un nuevo espacio de atributos multivariante cuyos ejes se rotan con respecto al espacio original. Los ejes (atributos) del nuevo espacio no están correlacionados. La principal razón para transformar los datos en un análisis de componentes principales es comprimir los datos eliminando la redundancia.

Un ejemplo de redundancia de datos es evidente en un ráster multibanda que comprende elevación, pendiente y orientación (en una escala continua). Dado que la pendiente y la orientación generalmente derivan de la elevación, la mayoría de las varianzas dentro del área de estudio se pueden explicar solamente por la elevación.

El resultado de la herramienta es un ráster multibanda con el mismo número de bandas que el número especificado de componentes (una banda por eje o componente en el nuevo espacio multivariante). El primer componente principal tendrá la varianza más grande, el segundo mostrará la segunda varianza más grande no descrita por el primero y así sucesivamente. Muchas veces, los primeros tres o cuatro rásteres del ráster multibanda resultante de la herramienta de componentes principales describirán más del 95 por ciento de la varianza. Las bandas de ráster individuales restantes se pueden eliminar. Dado que el nuevo ráster multibanda contiene menos bandas, y más del 95 por ciento de la varianza del ráster multibanda original está intacto, los cálculos serán más rápidos y la precisión se mantendrá.

Componentes principales requiere que se identifiquen las bandas de entrada, la cantidad de componentes principales en los que se transformarán los datos, el nombre del archivo de salida de estadísticas y el nombre del ráster de salida. El ráster de salida contendrá el mismo número de bandas que el número especificado de componentes. Cada banda representará un componente.

Conceptos del análisis de componentes principales

Conceptualmente, con un ráster de dos bandas, el cambio y la rotación de los ejes y la transformación de los datos se lleva a cabo de la siguiente manera:

  • Los datos se trazan en un gráfico de dispersión.
  • Se calcula una elipse para vincular los puntos del gráfico de dispersión (consulte la siguiente figura).
    Límite de elipse trazado
    Límite de elipse trazado
  • Se determina el eje mayor de la elipse (consulte la siguiente figura). El eje mayor se convierte en el nuevo eje x, el primer componente principal (PC1). PC1 representa la mayor variación porque es el transecto más grande que se puede dibujar a través de la elipse. La dirección de PC1 es el vector propio y su magnitud es el valor propio. El ángulo del eje x para PC1 es el ángulo de rotación que se utiliza en la transformación.
    Primer componente principal
    Primer componente principal
  • Se calcula una línea ortogonal perpendicular a PC1. Esta línea es el segundo componente principal (PC2) y el nuevo eje para el eje y original (consulte la siguiente figura). El nuevo eje describe la varianza más grande no descrita por PC1.
    Segundo componente principal
    Segundo componente principal

Con los vectores propios, los valores propios y la matriz de covarianza calculada de la entrada del ráster multibanda, se crea una fórmula lineal que define el cambio y la rotación. Esta fórmula se aplica para transformar cada valor de celda en relación con el nuevo eje.

Ejemplo

A continuación, se muestra un ejemplo del archivo de datos de salida creado para tres componentes principales:

                    COVARIANCE MATRIX
#    Layer            1            2            3
#  -----------------------------------------------------------
1           34.1763      31.2377      51.8100
2           31.2377     212.6159      99.9540
3           51.8100      99.9540     118.8057
#  ===========================================================

#                    CORRELATION MATRIX
#    Layer            1            2            3
#  -----------------------------------------------------------
1            1.0000       0.3665       0.8131
2            0.3665       1.0000       0.6289
3            0.8131       0.6289       1.0000
#  ===========================================================

#               EIGENVALUES AND EIGENVECTORS
# Number of Input Layers     Number of Principal Component Layers
3                                3
# PC Layer            1            2            3
#  -----------------------------------------------------------
# Eigen Values
287.8278      69.8781       7.8920
# Eigen Vectors
# Input Layer
1            0.2112       0.4718       0.8560
2            0.8116      -0.5727       0.1154
3            0.5447       0.6704      -0.5039
#  ===========================================================

Referencias

Campbell, James B. Introduction to Remote Sensing. The Guilford Press. 1987.

Jensen, John R. Introductory Digital Image Processing: A Remote Sensing Perspective. Prentice-Hall. 1986.

Lillesand, Thomas M. y Ralph W. Kiefer. Remote Sensing and Image Processing. John Wiley e hijos. 1987.

Richards, John A. Remote Sensing Digital Image Analysis: An Introduction. Berlín: Springer-Verlag. 1986.

Temas relacionados