Iso 聚类的工作原理

需要 Spatial Analyst 许可。

Iso 聚类工具采用改进的迭代优化聚类过程,也称为迁移平均值法。此算法在输入波段的多维空间中将所有像元分隔成用户指定数量的不同单峰组。此工具最常用于准备非监督分类。

isodata 聚类算法的前缀 iso 是执行聚类操作的迭代自组织方法的缩写。此类型的聚类采用的过程如下:在每次迭代期间,将所有样本分配给现有的聚类中心并为每个类重新计算新的平均值。通常,要指定的最佳类数是未知的。因此,建议您输入一个较大的数,分析所生成的聚类,然后使用较少的类数重新执行函数。

iso 聚类算法是一种迭代过程,用于在将各个候选像元指定给聚类时计算最小欧氏距离。该过程从处理软件指定的任意平均值开始,每个聚类一个任意平均值(您指定聚类数量)。将每个像元指定给最接近的平均值(多维属性空间中的所有平均值)。基于首次迭代后从属于每个聚类的像元的属性距离,重新计算各个聚类的新平均值。重复执行此过程:将各个像元指定给多维属性空间中最接近的平均值,然后基于迭代中像元的成员资格计算各个聚类的新平均值。您可通过迭代次数指定该过程的迭代次数。该值应该足够大,才能确保执行指定次数的迭代后,像元从一个聚类迁移至另一个聚类的次数最少;从而,使所有聚类变为稳定状态。迭代次数应该随着聚类数的增加而增加。

指定的类数目值是聚类过程可产生的最大聚类数。但是,输出特征文件中的聚类数可能与指定的类数不同。这种状况发生在下列情况下:

  • 数据值和初始聚类平均值分布不均匀。在某些像元值范围内,这些聚类的出现频率可能接近于零。因此,某些最初预定义的聚类平均值可能无法吸收足够多的像元成员。
  • 在迭代结束时,将消除由数量少于指定最小类大小值的像元组成的聚类。
  • 如果聚类稳定后统计值相似,则聚类将与邻近的聚类进行合并。某些聚类可能彼此间非常接近并且具有十分相似的统计数据,这使得将其分开会导致数据被不必要地分割开。

示例

以下为 Iso 聚类创建的特征文件示例。文件开头是一个添加注释的文件头,显示了执行 iso 聚类所使用的参数值。

类名称为可选名称,且在创建文件后使用文本编辑器输入。输入的类名称必须为单个字符串,并且长度不得超过 14 个字母数字字符。

# Signatures Produced by Clustering of 
#    Stack redlands
#    number_of_classes=6   max_iterations=20   min_class_size=20
#    sampling interval=10
#    Number of selected grids
/*           3
#    Layer-Number   Grid-name
/*           1      redlands1
/*           2      redlands2
/*           3      redlands3

# Type  Number of Classes   Number of Layers  Number of Parametric
                                                   Layers
   1             4                 3                 3
# ===============================================================

# Class ID     Number of Cells      Class Name
       1              1843 
# Layers   1             2             3
# Means 
        22.8817       60.7656       34.8893
# Covariance
1      169.3975      -69.7444      179.0808
2      -69.7444      714.7072       10.7889
3      179.0808       10.7889      284.0931
# ---------------------------------------------------------------

# Class ID     Number of Cells      Class Name
       2              2495 
# Layers   1             2             3
# Means 
         38.4894      132.9775       61.8104
# Covariance
1       414.9621      -19.0732      301.0267
2       -19.0732      510.8439      102.8931
3       301.0267      102.8931      376.5450
# ---------------------------------------------------------------
# Class ID     Number of Cells      Class Name
       3              2124 
# Layers   1             2             3
# Means 
         70.3983       82.9576       89.2472
# Covariance
1       264.2680      100.6966       39.3895
2       100.6966      523.9096       75.5573
3        39.3895       75.5573      279.7387
# ------------------------------------------------------------

# Class ID     Number of Cells      Class Name
       4              2438 
# Layers   1             2             3
# Means 105.8708      137.6645      130.0886
# Covariance
1       651.0465      175.1060      391.6028
2       175.1060      300.8853      143.2443
3       391.6028      143.2443      647.7345

参考资料

Ball, G. H., and D. J. Hall. 1965. A Novel Method of Data Analysis and Pattern Classification.Menlo Park, California:Stanford Research Institute.

Richards, J. A. 1986. Remote Sensing Digital Image Analysis:An Introduction..Berlin:Springer–Verlag.

相关主题


在本主题中
  1. 示例
  2. 参考资料