Fonctionnement de l’outil Agrégat Iso

Disponible avec une licence Spatial Analyst.

L’outil Agrégat Iso utilise une procédure d’agrégation d’optimisation itérative modifiée, également nommée technique de migration des moyennes. L’algorithme sépare toutes les cellules dans le nombre spécifié par l’utilisateur de groupes unimodaux distincts dans l’espace multidimensionnel des canaux en entrée. Cet outil est utilisé le plus souvent en préparation à la classification non assistée.

Le préfixe Iso de l’algorithme d’agrégation isodata signifie Iterative Self-Organizing (ISO), une méthode d’agrégation. Ce type d’agrégation utilise un processus dans lequel, pendant chaque itération, tous les échantillons sont affectés à des centres d’agrégat existants et les nouvelles moyennes sont recalculées pour chaque classe. Le nombre optimal de classes à spécifier est généralement inconnu. Par conséquent, il est conseillé d’entrer un nombre traditionnellement élevé, d’analyser les agrégats résultants et de ré-exécuter la fonction avec un nombre de classes réduit.

L’algorithme d’agrégat iso est un processus itératif pour calculer la distance euclidienne minimum lors de l’affectation de chaque cellule candidate à un agrégat. Le processus démarre par l’affectation de moyennes arbitraires par le logiciel, une pour chaque agrégat (vous déterminez le nombre d’agrégats). Chaque cellule est affectée à la plus proche de ces moyennes (toutes dans l’espace attributaire multidimensionnel). Les nouvelles moyennes sont recalculées pour chaque agrégat en fonction des distances attributaires des cellules appartenant à l’agrégat après la première itération. Le processus est répété : chaque cellule est assignée à la moyenne la plus proche dans l’espace attributaire multidimensionnel, et les nouvelles moyennes sont calculées pour chaque agrégat en fonction de l’appartenance des cellules de l’itération. Vous pouvez spécifier le nombre d’itérations du processus via le paramètre Number of iterations (Nombre d’itérations). Cette valeur doit être suffisamment élevée pour garantir qu’après l’exécution du nombre spécifié d’itérations, la migration des cellules d’un agrégat à un autre est minimale. Par conséquent, tous les agrégats deviennent stables. Si vous augmentez le nombre d’agrégats, vous devez également augmenter le nombre d’itérations.

La valeur Number of classes (Nombre de classes) spécifiée correspond au nombre maximum d’agrégats pouvant résulter du processus d’agrégation. Toutefois, le nombre d’agrégats dans le fichier de signatures en sortie peut être différent du nombre de classes spécifié. Cette situation se présente dans les cas suivants :

  • Les valeurs des données et les moyennes d’agrégat initiales ne sont pas distribuées de manière égale. Dans certaines plages de valeurs de cellule, la fréquence des occurrences de ces agrégats peut être proche de zéro. Par conséquent, certaines des moyennes d’agrégat initialement prédéfinies peuvent ne pas avoir la possibilité d’absorber suffisamment de membres de cellule.
  • Les agrégats contenant moins de cellules que la valeur Minimum class size (Taille de classe minimum) spécifiée seront éliminés à la fin des itérations.
  • Les agrégats fusionnent avec des agrégats voisins lorsque les valeurs statistiques sont similaires une fois les agrégats devenus stables. Certains agrégats peuvent être si proches les uns des autres et posséder de telles statistiques similaires que les mettre de côté serait une division inutile des données.

Exemple

Voici un exemple de fichier de signatures créé par l’outil Agrégat Iso. Le fichier commence par un en-tête, mis en commentaire, qui affiche les valeurs des paramètres utilisés pour effectuer l’agrégation iso.

Les noms des classes sont facultatifs et sont saisis après la création du fichier avec un éditeur de texte. Chaque nom de classe, s’il est saisi, doit consister en une chaîne unique de caractères qui n’excède pas 31 caractères alphanumériques.

# Signatures Produced by Clustering of 
#    Stack redlands
#    number_of_classes=6   max_iterations=20   min_class_size=20
#    sampling interval=10
#    Number of selected grids
/*           3
#    Layer-Number   Grid-name
/*           1      redlands1
/*           2      redlands2
/*           3      redlands3

# Type  Number of Classes   Number of Layers  Number of Parametric
                                                   Layers
   1             4                 3                 3
# ===============================================================

# Class ID     Number of Cells      Class Name
       1              1843 
# Layers   1             2             3
# Means 
        22.8817       60.7656       34.8893
# Covariance
1      169.3975      -69.7444      179.0808
2      -69.7444      714.7072       10.7889
3      179.0808       10.7889      284.0931
# ---------------------------------------------------------------

# Class ID     Number of Cells      Class Name
       2              2495 
# Layers   1             2             3
# Means 
         38.4894      132.9775       61.8104
# Covariance
1       414.9621      -19.0732      301.0267
2       -19.0732      510.8439      102.8931
3       301.0267      102.8931      376.5450
# ---------------------------------------------------------------
# Class ID     Number of Cells      Class Name
       3              2124 
# Layers   1             2             3
# Means 
         70.3983       82.9576       89.2472
# Covariance
1       264.2680      100.6966       39.3895
2       100.6966      523.9096       75.5573
3        39.3895       75.5573      279.7387
# ------------------------------------------------------------

# Class ID     Number of Cells      Class Name
       4              2438 
# Layers   1             2             3
# Means 105.8708      137.6645      130.0886
# Covariance
1       651.0465      175.1060      391.6028
2       175.1060      300.8853      143.2443
3       391.6028      143.2443      647.7345

Bibliographie

Ball, G. H., and D. J. Hall. 1965. A Novel Method of Data Analysis and Pattern Classification. Menlo Park, California: Stanford Research Institute.

Richards, J. A. 1986. Remote Sensing Digital Image Analysis: An Introduction.. Berlin: Springer–Verlag.

Rubriques connexes


Dans cette rubrique
  1. Exemple
  2. Bibliographie