主成分分析 (Principal Components) ツールの仕組み

Spatial Analyst のライセンスで利用可能。

[主成分分析 (Principal Components)] ツールは、入力バンドのデータを、入力の多変量属性空間から、元の空間を基準として軸を回転した新しい多変量属性空間に変換するために使用されます。 新しい空間の軸 (属性) 同士に相関はありません。 主成分分析でデータを変換する主な理由は、重複を除去することによりデータを圧縮することです。

たとえば、標高、傾斜角、および傾斜方向 (連続スケール) で構成されるマルチバンド ラスターには、明らかにデータの重複があります。 傾斜角と傾斜方向は通常、標高から得られるので分析範囲内の分散の多くは標高で説明できます。

このツールの結果は、指定された数の成分と同数のバンドを持つマルチバンド ラスターです (新しい多変量空間の軸または成分につき 1 バンド)。 第一主成分は最大の分散を持ち、第二主成分は第一主成分が表さない 2 番目に多い分散を表し、以降の成分も同様です。 多くの場合、主成分分析ツールから得られたマルチバンド ラスターの最初の 3 つか 4 つのラスターが分散の 95% 以上を表します。 残りの個々のラスター バンドは削除できます。 新しいマルチバンド ラスターのバンド数は少なくなり、元のマルチバンド ラスターの分散の 95% 以上はそのまま維持されるので、計算は高速になり、精度は維持されます。

[主成分分析 (Principal Components)] ツールには、特定する入力バンド、データの変換先の主成分の個数、統計情報の出力ファイル名、および出力ラスターの名前が必要です。 出力ラスターには、指定した成分の個数と同数のバンドがあります。 各バンドが各成分を表します。

主成分分析の概念

概念的には、2 つのバンドを持つ 1 つのラスターを使用すると、軸のシフトと回転、およびデータの変換は次のように実行されます。

  • データが散布図にプロットされます。
  • 散布図のポイントを囲む楕円が計算されます (下図参照)。
    楕円の境界のプロット
    楕円の境界のプロット
  • 楕円の長軸が決定されます (下図参照)。 長軸が、第一主成分 (PC1) を表す新しい X 軸になります。 PC1 は、楕円を通る線分の長さが最大になるので、最大の分散を表します。 PC1 の方向は固有ベクトルで、その大きさは固有値です。 PC1 に対する X 軸の角度が、変換に使用される回転角度です。
    第一主成分
    第一主成分
  • PC1 に対する直交線が計算されます。 この線が第二主成分 (PC2) で、元の Y 軸に対する新しい軸です (下図参照)。 新しい軸は、PC1 が表さない最大の分散を表します。
    第二主成分
    第二主成分

固有ベクトル、固有値、および入力のマルチバンド ラスターから計算した共分散マトリックスを使用して、シフトと回転を定義する線形の式が作成されます。 この式が適用され、各セルの値が新しい軸に対して変換されます。

3 つの主成分について作成された出力データ ファイルの例を次に示します。

                    COVARIANCE MATRIX
#    Layer            1            2            3
#  -----------------------------------------------------------
1           34.1763      31.2377      51.8100
2           31.2377     212.6159      99.9540
3           51.8100      99.9540     118.8057
#  ===========================================================

#                    CORRELATION MATRIX
#    Layer            1            2            3
#  -----------------------------------------------------------
1            1.0000       0.3665       0.8131
2            0.3665       1.0000       0.6289
3            0.8131       0.6289       1.0000
#  ===========================================================

#               EIGENVALUES AND EIGENVECTORS
# Number of Input Layers     Number of Principal Component Layers
3                                3
# PC Layer            1            2            3
#  -----------------------------------------------------------
# Eigen Values
287.8278      69.8781       7.8920
# Eigen Vectors
# Input Layer
1            0.2112       0.4718       0.8560
2            0.8116      -0.5727       0.1154
3            0.5447       0.6704      -0.5039
#  ===========================================================

参考文献

Campbell, James B. Introduction to Remote Sensing. The Guilford Press. 1987.

Jensen, John R. Introductory Digital Image Processing: A Remote Sensing Perspective. Prentice–Hall. 1986.

Lillesand, Thomas M., and Ralph W. Kiefer. Remote Sensing and Image Processing. John Wiley and Sons. 1987.

Richards, John A. Remote Sensing Digital Image Analysis: An Introduction. Berlin: Springer–Verlag. 1986.

関連トピック


このトピックの内容
  1. 主成分分析の概念
  2. 参考文献