多次元主成分分析 (Multidimensional Principal Components) のしくみ

Image Analyst ライセンスで利用できます。

主成分分析 (PCA) は、探索的データ解析で従来から使用されている手法です。 この手法は、多くの場合、データセットの次元を減らし、データのフィーチャやパターンを識別できるようにするために使用されます。 たとえば、多変量解析では、PCA を使用して、分析結果に影響せずに、必要な変数と除外できる変数を特定できます。 マルチスペクトルおよびハイパースペクトル画像解析では、[多次元主成分分析 (Multidimensional Principle Components)] ツールを使用して、ほとんどの情報をキャプチャし、バンド数を減らして分析を実行できるようにする主成分セットを計算します。 画像の時系列データがより一般的になっていますが、対象となる情報の特定と抽出には難題があります。 このツールでは、時系列データまたは多次元ラスター データを分析するため、PCA 手法が使用されます。

多次元ラスター データセットの主成分分析

多次元ラスターには 1 つまたは複数の変数が含まれます。 [多次元主成分分析(Multidimensional Principal Components)] ツールは、1 つの変数である、(x,y,time) と (x,y,z) のいずれかを含む 3D 画像データ キューブを一度に分析し、画像データ キューブを主成分セットに変換します。変換により、データ内のフィーチャとパターンを識別して抽出できるよう、分散が最大化されます。 画像データ キューブは 2 つの方法、つまりそれぞれが時間内の画像を表す一連の画像 (スライス)、またはそれぞれがピクセル時系列 (時間プロファイル) を表す一連の 1 次元配列で表示できます。 以下の例では、画像の時系列データを使用し、ツールが非時間次元のデータに適用できることを理解するとともにツールの機能を説明します。

一連の画像
ディメンションの削減モードは一連の画像を解析します。

一連のピクセル時系列
空間の削減モードはピクセル時系列を解析します。

主成分分析は、ディメンションの削減モードと空間の削減モードを使用して適用できます。 これらの 2 つのモードによる処理には、2 つの異なるアプリケーションが必要です。

  • ディメンションの削減モードは、データを一連の画像として解析します。 主要なフィーチャとパターンを収集する一連の画像にデータを変換して削減します。 たとえば、画像の時系列に広く存在している水のピクセルを抽出し、時間の経過に伴う水域の変化をマッピングします。 ディメンション削減モードは、NDVI 時系列などの土地データの画像の時系列解析でよく使用されます。
  • 空間の削減モードは、データを一連のピクセル時系列として解析します。 これにより、主要な時間パターンと、関連付けられた時間パターンの空間位置を識別します。 たとえば、海面温度データとその位置を使用して、エルニーニョ現象とラニーニャ現象の年ごとの時間パターンを抽出できます。 これは、長い時系列の分析には適していますが、高解像度のデータには適していません。

多次元主成分分析ツールの例

以下の例では、画像の時系列には k 個の画像、X1、X2、… Xk が含まれており、計算された主成分は、次のように表される画像の線形結合です。

PC1 = a11X1 + a12X2 + … + a1kXk

すべての主成分のマトリックス形式は次のとおりです。

Y = XA

ここで、

Y = (PC1, PC2, …, PCk)
は、主成分を含むマトリックスです。
X = (X1, X2, …, Xk)
は、入力データを含むマトリックスです。

マトリックス A は、元のデータを主成分に変換する係数を含みます。 マトリックス A の値は負荷量と呼ばれ、各画像が特定の主成分に寄与する程度を表します。 大きい負荷量は、画像と特定の主成分との関係が強いことを示します。 負荷量の符号は、画像と主成分が正と負のどちらの相関関係にあるかを示します。

マトリックス A の正規化列は固有ベクトルで、元の画像に関連する主成分の方向を示します。 固有ベクトルとともに算出される固有値は、各主成分によって説明される分散を示します。 最大から最小の順に並べられた固有値が主成分の順序を決定します。

最初の成分は、データ内で可能な最大の分散を説明するように計算され、2 番目の成分は、最初の成分と無相関 (垂直) であるという条件で、次に大きい分散を構成します。 指定された成分の総数が計算されるまで、これが続きます。 すべての主成分を計算する場合は、元のデータに含まれるすべての情報が保持されます。

詳細については、「主成分分析 (PCA) の概要」をご参照ください。

詳細については、[多次元主成分分析 (Multidimensional Principal Components)] ツールをご参照ください。

関連トピック