Disponible avec une licence Spatial Analyst.
L'outil Iso Cluster utilise une optimisation itérative modifiée, également appelée migration de moyennes. L'algorithme sépare toutes les cellules dans le nombre spécifié par l'utilisateur dans les groupes distincts dans l'espace multidimensionnel des canaux en entrée. Cet outil est utilisé le plus souvent pour effectuer une classification non assistée.
Le préfixe iso de l'algorithme d'agrégation isodata est l'acronyme de "Iterative Self Organizing" (auto-organisation itérative), c'est-à-dire une méthode qui permet d'effectuer l'agrégation. Ce type d'agrégation repose sur un processus qui, au cours d'une itération, attribue tous les échantillons à des centres d'agrégation existants et recalcule les moyennes de chaque classe. En général, le nombre optimal de classes à spécifier n'est pas connu. Il est donc préférable de saisir un nombre élevé, d'analyser les agrégats obtenus et de relancer la fonction avec un nombre de classes restreint.
L'algorithme iso cluster est un procédé itératif permettant de calculer la distance euclidienne minimale lorsque vous attribuez une cellule à un agrégat. Le processus démarre avec des moyennes arbitraires qui sont attribuées par le logiciel, une pour chaque agrégat (vous devez indiquer le nombre d'agrégats). Chaque cellule est attribuée à la moyenne la plus proche (dans l'espace attributaire multidimensionnel). Le système recalcule les nouvelles moyennes pour chaque agrégat, compte tenu des distances attributaires associées à l'agrégat après la première itération. Ce processus est renouvelé : chaque cellule est attribuée à la moyenne la plus proche dans l'espace attributaire multidimensionnel. Les nouvelles moyennes sont calculées pour chaque agrégat en fonction de l'appartenance des cellules issues de l'itération. Vous pouvez spécifier le nombre d'itérations du processus via l'outil Nombre d'itérations. Cette valeur doit être suffisante pour que la migration d'un agrégat à l'autre soit minimale lorsque vous avez traité le nombre d'itérations spécifié. Les agrégats deviennent donc tous stables. Lors de l'augmentation du nombre d'agrégats, le nombre d'itérations également s'accroître.
La valeur Nombre de classes spécifiée est le nombre maximal des agrégats qui peuvent résulter du processus d'agrégation. Toutefois, le nombre d'agrégats dans le fichier de signatures en sortie ne peut pas être le même que le nombre spécifié pour le nombre de classes. Cette situation se présente dans les cas suivants :
- Les valeurs des données et les moyens d'agrégat initiaux ne sont pas équitablement distribuées. Dans certaines plages de valeurs de la cellule, la fréquence des occurrences pour ces agrégats avoisine zéro. Par conséquent, quelques-uns des moyens d'agrégat prédéfinis initialement ne peuvent pas permettre d'absorber un nombre de cellules suffisant.
- Les agrégats composés d'un nombre de cellules inférieure à celui qui est indiqué dans la taille de classe minimale sont supprimés à la fin des itérations.
- Les agrégats intègrent les agrégats environnants lorsque des valeurs statistiques s'apparentent après la stabilisation. Certains agrégats sont si proches les uns des autres avec des statistiques semblables que vous ne pouvez pas les conserver à part sans diviser inutilement les données.
Exemple
A titre d'exemple, voici un fichier de signatures créé par Iso cluster. Le fichier débute avec un en-tête qui fait l'objet de commentaires. Il décrit les valeurs des paramètres employés pour effectuer une agrégation.
Les noms de classes sont facultatifs. Vous ne devez les indiquez qu'après avoir créé le fichier via un éditeur de texte. Chaque nom de classe doit être une chaîne de caractères distincte qui n'excède pas 14 caractères alphanumériques en longueur.
# Signatures Produced by Clustering of # Stack redlands # number_of_classes=6 max_iterations=20 min_class_size=20 # sampling interval=10 # Number of selected grids /* 3 # Layer-Number Grid-name /* 1 redlands1 /* 2 redlands2 /* 3 redlands3 # Type Number of Classes Number of Layers Number of Parametric Layers 1 4 3 3 # =============================================================== # Class ID Number of Cells Class Name 1 1843 # Layers 1 2 3 # Means 22.8817 60.7656 34.8893 # Covariance 1 169.3975 -69.7444 179.0808 2 -69.7444 714.7072 10.7889 3 179.0808 10.7889 284.0931 # --------------------------------------------------------------- # Class ID Number of Cells Class Name 2 2495 # Layers 1 2 3 # Means 38.4894 132.9775 61.8104 # Covariance 1 414.9621 -19.0732 301.0267 2 -19.0732 510.8439 102.8931 3 301.0267 102.8931 376.5450 # --------------------------------------------------------------- # Class ID Number of Cells Class Name 3 2124 # Layers 1 2 3 # Means 70.3983 82.9576 89.2472 # Covariance 1 264.2680 100.6966 39.3895 2 100.6966 523.9096 75.5573 3 39.3895 75.5573 279.7387 # ------------------------------------------------------------ # Class ID Number of Cells Class Name 4 2438 # Layers 1 2 3 # Means 105.8708 137.6645 130.0886 # Covariance 1 651.0465 175.1060 391.6028 2 175.1060 300.8853 143.2443 3 391.6028 143.2443 647.7345
Bibliographie
Ball, G. H. et D. J. Hall. 1965. A Novel Method of Data Analysis and Pattern Classification. Menlo Park, California : Stanford Research Institute.
Richards, J. A. 1986. Remote Sensing Digital Image Analysis : présentation.. Berlin : Springer-Verlag.
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?