Как работает инструмент Метод главных компонент

Доступно с лицензией Spatial Analyst.

Инструмент Метод главных компонент используется для преобразования данных в стеке из входного многомерного атрибутивного пространства в новое многомерное атрибутивное пространство, оси которого повернуты по отношению к осям исходного пространства. Оси (атрибуты) в новом пространстве некоррелированы. Главная причина преобразования данных при выполнении анализа по методу главных компонент – сжатие данных путем исключения избыточности, существующей в данных.

Избыточность данных может быть пояснена на примере многоканального растра, образованного из растров высот, уклонов и экспозиции склонов (с непрерывной шкалой). Поскольку уклоны и экспозиция, как правило, извлекаются из растра высот, большая доля дисперсии для изучаемой территории может быть объяснена с помощью высот.

Результатом работы инструмента является многоканальный растр, где количество каналов равняется заданному числу компонент (один канал на ось или компонента в новом многомерном пространстве). Первая главная компонента будет характеризоваться наибольшей дисперсией, вторая – будет соответствовать второму по величине значению дисперсии, не охарактеризованному первой главной компонентой, и так далее. В большинстве случаев, первые три или четыре растра результирующего многоканального растра, полученного в результате инструмента Метод главных компонент, будут описывать более 95 процентов дисперсии. Остальные индивидуальные каналы растра могут быть отброшены. Поскольку новый многоканальный растр содержит меньшее число каналов, и более 95 процентов дисперсии исходного многоканального растра осталась нетронутой, вычисления будут выполняться быстрее, а их точность при этом сохраняется.

Для инструмента Метод главных компонент требуется, чтобы были определены входные каналы, число главных компонент, в которые будут трансформироваться данные, имя выходного файла статистики и имя выходного растра. Выходной растр будет содержать столько же каналов, сколько задано компонент. Каждый канал будет изображать компоненту.

Основные принципы анализа по методу главных компонент

При использовании двухканального растра, перемещение и вращение осей и трансформация данных осуществляется следующим образом:

  • Данные приведены на диаграмме рассеяния.
  • Для связи точек на диаграмме рассеяния вычисляется эллипс (см. рисунок ниже).
    Построенные границы эллипса
    Построенные границы эллипса
  • Определяется главная ось эллипса (см. рисунок ниже). Главная ось станет новой осью x, первой главной компонентой (PC1). PC1 изображает наибольшую дисперсию, т.к. это самая большая трансекта, которую можно нарисовать через эллипс. Направлением PC1 является собственный вектор, а его величиной – собственное значение. Угол оси x к PC1 – это угол поворота, который используется в трансформации.
    Первая главная компонента
    Первая главная компонента
  • Вычисляется перпендикуляр ортогональной линии к PC1. Эта линия является второй главной компонентой (PC2) и новой осью для исходной оси y (см. рисунок ниже). Новая ось отражает самую большую дисперсию, что не делает PC1.
    Вторая главная компонента
    Вторая главная компонента

При использовании собственных векторов, собственных значений и вычисленной ковариационной матрицы входных данных многоканального растра, создается линейная формула, определяющая сдвиг и поворот. Эта формула применяется для трансформации каждого значения ячейки относительно новой оси.

Пример:

Ниже приведен пример файла выходных данных, созданного для трех главных компонент:

                    COVARIANCE MATRIX
#    Layer            1            2            3
#  -----------------------------------------------------------
1           34.1763      31.2377      51.8100
2           31.2377     212.6159      99.9540
3           51.8100      99.9540     118.8057
#  ===========================================================
#                    CORRELATION MATRIX
#    Layer            1            2            3
#  -----------------------------------------------------------
1            1.0000       0.3665       0.8131
2            0.3665       1.0000       0.6289
3            0.8131       0.6289       1.0000
#  ===========================================================
#               EIGENVALUES AND EIGENVECTORS
# Number of Input Layers     Number of Principal Component Layers
3                                3
# PC Layer            1            2            3
#  -----------------------------------------------------------
# Eigen Values
287.8278      69.8781       7.8920
# Eigen Vectors
# Input Layer
1            0.2112       0.4718       0.8560
2            0.8116      -0.5727       0.1154
3            0.5447       0.6704      -0.5039
#  ===========================================================

Литература

Campbell, James B. Введение в дистанционное зондирование. The Guilford Press. 1987.

Jensen, John R. Introductory Digital Image Processing: A Remote Sensing Perspective. Prentice–Hall. 1986.

Lillesand, Thomas M., and Ralph W. Kiefer. Remote Sensing and Image Processing. John Wiley and Sons. 1987.

Richards, John A. Remote Sensing Digital Image Analysis: An Introduction. Berlin: Springer–Verlag. 1986.

Связанные разделы