Cómo funciona Componentes principales

Disponible con una licencia de Spatial Analyst.

La herramienta Componentes principales se utiliza para transformar los datos en las bandas de entrada desde el espacio de atributos multivariante de entrada en un nuevo espacio de atributos multivariante cuyos ejes se rotan con respecto al espacio original. Los ejes (atributos) en el nuevo espacio no están correlacionados. La principal razón para transformar los datos en un análisis de componentes principales es comprimir los datos mediante la eliminación de la redundancia.

Un ejemplo de redundancia de datos evidente se da en un ráster multibanda que está constituido por elevación, pendiente y orientación (en una escala continua). Debido a que la pendiente y la orientación generalmente se derivan de la elevación, la mayoría de las varianzas dentro del área de estudio se pueden explicar solamente mediante la elevación.

El resultado de la herramienta es un ráster multibanda con la misma cantidad de bandas que la cantidad de componentes especificado (una banda por eje o componente en el nuevo espacio multivariante). El primer componente principal tendrá la varianza más grande, el segundo mostrará la segunda varianza más grande no descrita por el primero y así sucesivamente. Por lo general, los primeros tres o cuatro rásteres del ráster multibanda resultante de la herramienta de componentes principales describirán más del 95 por ciento de la varianza. Las bandas de ráster individuales restantes se pueden eliminar. Debido a que el nuevo ráster multibanda contiene menos bandas, y más del 95 por ciento de la varianza del ráster multibanda original está intacto, los cómputos serán más rápidos, y la exactitud se mantendrá.

Componentes principales requiere que se identifiquen las bandas de entrada, la cantidad de componentes principales en los que se transformarán los datos, el nombre del archivo de estadísticas de salida y el nombre del ráster de salida. El ráster de salida contendrá la misma cantidad de bandas que la cantidad de componentes especificada. Cada banda representará un componente.

Conceptos del análisis de componentes principales

Conceptualmente, cuando se utiliza un ráster de dos bandas, los cambios y las rotaciones de los ejes y la transformación de los datos se realizan de la siguiente manera:

  • Los datos se grafican en un diagrama de dispersión.
  • Se calcula una elipse para vincular los puntos en el diagrama de dispersión (vea la siguiente figura).
    Se grafica el límite de la elipse
    Se grafica el límite de la elipse
  • Se determina el eje mayor de la elipse (vea la siguiente figura). El eje mayor se convierte en el nuevo eje x, el primer componente principal (PC1). PC1 representa la mayor variación ya que es el corte transversal más grande que se puede dibujar en la elipse. La dirección de PC1 es el vector eigen, y su magnitud es el valor eigen. El ángulo del eje x para PC1 es el ángulo de rotación que se utiliza en la transformación.
    Primer componente principal
    Primer componente principal
  • Se calcula una línea ortogonal perpendicular a PC1. Esta línea es el segundo componente principal (PC2) y el nuevo eje para el eje y original (vea la siguiente figura). El nuevo eje describe la variación mayor no descrita por PC1.
    Segundo componente principal
    Segundo componente principal

Mediante el uso de los vectores eigen, los valores eigen y la matriz de covarianza calculada de la entrada del ráster multibanda, se crea una fórmula lineal que define los cambios y la rotación. Esta fórmula se aplica para transformar cada valor de celda en relación al nuevo eje.

Ejemplo

El siguiente es un ejemplo del archivo de datos de salida que se creó para los tres componentes principales:

                    COVARIANCE MATRIX #    Layer            1            2            3 #  ----------------------------------------------------------- 1           34.1763      31.2377      51.8100 2           31.2377     212.6159      99.9540 3           51.8100      99.9540     118.8057 #  ===========================================================  #                    CORRELATION MATRIX #    Layer            1            2            3 #  ----------------------------------------------------------- 1            1.0000       0.3665       0.8131 2            0.3665       1.0000       0.6289 3            0.8131       0.6289       1.0000 #  ===========================================================  #               EIGENVALUES AND EIGENVECTORS # Number of Input Layers     Number of Principal Component Layers 3                                3 # PC Layer            1            2            3 #  ----------------------------------------------------------- # Eigen Values 287.8278      69.8781       7.8920 # Eigen Vectors # Input Layer 1            0.2112       0.4718       0.8560 2            0.8116      -0.5727       0.1154 3            0.5447       0.6704      -0.5039 #  =========================================================== 

Referencias

Campbell, James B. Introduction to Remote Sensing. The Guilford Press. 1987.

Jensen, John R. Introductory Digital Image Processing: A Remote Sensing Perspective. Prentice-Hall. 1986.

Lillesand, Thomas M. y Ralph W. Kiefer. Remote Sensing and Image Processing. John Wiley e hijos. 1987.

Richards, John A. Remote Sensing Digital Image Analysis: An Introduction. Berlín: Springer-Verlag. 1986.

Temas relacionados