多维主成分分析的工作原理

获得 Image Analyst 许可后可用。

主成分分析 (PCA) 是一种用于探索性数据分析的经典技术。 它通常用于降低数据集的维数,以便您可以识别数据中的要素和模式。 例如,在多变量分析中,可以使用 PCA 来识别哪些变量是必要的,哪些变量可以排除,而不影响分析结果。 在多光谱和高光谱图像分析中,多维主成分分析工具可用于计算一组能够捕获大部分信息的主成分,并允许对较少数量的波段进行分析。 图像时间序列数据的使用日益普遍,但对识别和提取目标信息提出了挑战。 该工具使用 PCA 技术分析时间序列数据或多维栅格数据。

多维栅格数据主成分分析

多维栅格包含一个或多个变量。 多维主成分分析工具一次分析一个变量,即具有 (x,y,time) 或 (x,y,z) 的 3D 图像数据立方体,并将图像数据立方体转换为一组主成分,其中对方差进行最大化处理,以便可以识别和提取数据中的要素和模式。 可以通过两种方式查看图像数据立方体:一组图像(切片),每个图像代表一个时间图像;或一组一维数组,每个代表一个像素时间序列(时间分布)。 在以下示例中,图像时间序列数据用于描述功能,并且该工具可以应用于具有非时间维度的数据:

一组图像
通过降维模式分析一组图像。

一组像素时间序列
通过空间缩减模式分析像素时间序列。

您可以使用降维模式和空间缩减模式应用主成分分析。 这两种模式的处理涉及两种不同的应用。

  • 降维模式将数据作为一组图像进行分析。 它将数据转换并减少为一组可以捕获主要要素和模式的图像。 例如,您可以提取图像时间序列中普遍存在的水像素,并绘制水体随时间变化的地图。 降维模式常用于陆地数据的图像时间序列分析,例如 NDVI 时间序列。
  • 空间缩减模式将数据作为一组像素时间序列进行分析。 它将识别主要时间模式和这些时间模式的关联空间位置。 例如,您可以使用海面温度数据及其位置提取厄尔尼诺和拉尼娜事件的年际时间模式。 这适用于长时间序列的分析,但不适用于高分辨率数据。

多维主成分分析工具示例

在以下示例中,图像时间序列包含 k 个图像 X1、X2、...、Xk,计算的主成分是图像的线性组合,表示如下:

PC1 = a11X1 + a12X2 + … + a1kXk

其所有主成分的矩阵形式为:

Y = XA

其中:

Y = (PC1, PC2, …, PCk)
为包含主成分的矩阵,而
X = (X1, X2, …, Xk)
为包含输入数据的矩阵。

矩阵 A 包含将原始数据转换为主成分的系数。 矩阵 A 的值称为负载,它描述了每个图像对特定主成分的贡献程度。 负载值越大表明图像与特定主成分之前的关系越强。 负载符号表示图像和主成分是正相关还是负相关。

矩阵 A 中的归一化列为特征向量,它指定了主成分相对于原始图像的方向。 与特征向量一起计算的特征值表示每个主成分解释的方差。 从大到小排列的特征值决定了主成分的顺序。

计算第一个成分以用其说明数据中可能的最大方差,第二个成分用于说明次高方差,条件是它与第一个成分不相关(垂直),依此类推。 这一直持续到计算出指定成分的总数。 如果计算所有主成分,则将保留原始数据中包含的所有信息。

有关详细信息,请参阅主成分分析 (PCA) 简介

有关详细信息,请参阅多维主成分分析工具。

相关主题