Fonctionnement de l'outil Dendrogramme

Disponible avec une licence Spatial Analyst.

Un dendrogramme est un diagramme qui affiche les distances attributaires entre chaque paire de classes combinées séquentiellement. Pour éviter les lignes entrecroisées, le système actualise le diagramme pour que les membres de chaque paire de classes à fusionner soient adjacents dans le diagramme.

L'outil Dendrogramme utilise un algorithme d'agrégation hiérarchique. Le programme commence par calculer les distances entre chaque paire de classes dans le fichier de signatures en entrée. Ensuite, il fusionne successivement les paires de classes les plus proches. Après chaque fusion, les distances entre toutes les paires de classes sont mises à jour. Les distances auxquelles les signatures de classes sont fusionnées permettent de créer un dendrogramme.

Lorsque vous désactivez l'option Utiliser la variance dans les calculs de distance (MEAN_ONLY dans Python), la distance dmn entre une paire de classes m et n est mesurée sous la forme d'une distance entre deux moyennes :

Formule permettant de calculer une distance entre deux moyennes
  • où :

    m et n : identifiants des classes

    i : numéro de couche

    µ : moyenne d'une classe m ou n dans la couche i

Lorsque l'option de variance est activée (VARIANCE dans Python), l'outil Dendrogramme mesure des distances entre les paires de classes selon leurs moyennes et variances à l'aide de la formule suivante :

Equation permettant de mesurer la distance entre des paires de classes
  • V est une variance de la classe m ou n dans la couche i.

Les nouvelles statistiques (moyennes et variances) qui décrivent la classe combinée sont basées sur la moyenne originale et la variance des échantillons qui figurent dans la classe combinée. Par conséquent, la classe combinée est produite à l'aide de la moyenne mise en commun et de la variance. Les deux signatures qui permettent de créer la classe combinée sont remplacées par une signature distincte de la classe combinée. La nouvelle signature moyenne est calculée selon les emplacements dans l'espace attributaire multidimensionnel de toutes les cellules membres de la classe combinée. La nouvelle signature conserve le nombre inférieur des deux classes en entrée de l'identifiant de classe combinée.

Les niveaux de valeur ou les distances auxquelles chaque paire de classes est fusionnée, peuvent être interpolés à l'aide des barres d'échelle du dendrogramme. En raison de la limitation de la taille d'un caractère (la résolution grossière du graphique), les niveaux de la fusion sont arrondis pour l'affichage. Toutefois, les valeurs précises des niveaux de la fusion sont présentées en tant que DISTANCE dans la table associée au dendrogramme.

Les variances (et non les covariances) permettent de calculer une distance après la fusion d'une paire de classes. L'algorithme utilisé par l'outil Dendrogramme n'utilise pas la distance Mahalanobis pour calculer la distance entre des classes. Par conséquent, les distances entre classes et les classes combinées ne peuvent pas correspondre aux résultats de ces outils de grille basés sur Mahalanobis, notamment Modifier des signatures, Classification de vraisemblance maximale et Probabilité de classe.

Le dendogramme permet de réduire les erreurs de classification statistique dans votre analyse en indiquant s'il convient de fusionner ou de séparer les classes de données. Si les classes de votre analyse sont trop proches d'un point de vue statistique (c'est-à-dire que les statistiques de deux classes ne permettent pas de les différencier facilement), des erreurs de classification risquent de se produire. Dans ce cas, envisagez de fusionner les classes. Il n'existe pas de règle indiquant si les classes doivent être fusionnées ou pas. Quand les fusionner ? Tout dépend de l'hétérogénéité de votre zone d'étude et de vos données, du nombre de classes que vous essayez d'utiliser pour classer vos données et de vos objectifs. Par exemple, si votre zone d'étude est très hétérogène, vous pouvez utiliser de nombreuses classes distinctes. Dans ce cas, la fusion des classes n'est pas nécessaire. Si vos données sont plus homogènes, vous serez peut-être tenté de les classer en un trop grand nombre de classes. Dans ce cas, les classes risquent d'être statistiquement trop proches ; il convient alors de fusionner certaines d'entre elles.

Si votre analyse ne requiert pas de classes détaillées, vous pouvez fusionner les classes dans des catégories plus générales pour limiter les risques d'erreurs de classification. Le dendogramme identifie les classes statistiquement les plus proches, mais c'est vous qui devez déterminer s'il convient de fusionner les classes en vous basant sur votre connaissance de la zone et sur vos objectifs.

Par exemple, si vous avez spécifié une classe "zones humides générales" et une autre "marais", vous pouvez les fusionner. Toutefois, les statistiques des deux classes déterminées par les échantillons d'apprentissage sont très similaires. Par conséquent, les deux classes seront proches dans le dendogramme résultant. Si vous souhaitez uniquement identifier les zones humides, il est conseillé de fusionner la classe "marais" avec la classe "zones humides générales".

Le dendogramme permet non seulement d'identifier les classes à fusionner, mais il indique également quand en ajouter. Si une classe est statistiquement éloignée d'une autre classe, vous pouvez en ajouter d'autres pour affiner la classification. Par exemple, vous pouvez spécifier une classe "récoltes" et une autre "herbe". Dans le dendogramme résultant, ces deux classes peuvent être éloignées. Toutefois, supposons que vous disposiez d'un raster multicanal haute résolution. Si vous analysez le résultat agricole de la zone, les données de résolution plus élevée vous permettront éventuellement d'affiner les classes "récoltes" et "herbe" en types de récoltes spécifiques.

Exemple

Dans l'exemple suivant, les classes 3 et 5 sont les voisins les plus proches dans l'espace attributaire ; par conséquent, elles sont fusionnées au niveau 3,443. Cette valeur indique le degré relatif de ressemblance, qui peut également s'apparenter à la distance dans un espace multidimensionnel. Les deux classes sont fusionnées et traitées sous la forme d'une classe distincte. Les statistiques pour la classe combinée et les distances de la classe combinée aux autres classes sont calculées. Ensuite, les deux classes suivantes les plus proches sont identifiées. Les deux classes admises sont les classes 4 et 6. La distance qui les sépare est 3,609. Elles sont ensuite fusionnées. Cette procédure est renouvelée. Toutes les classes sont fusionnées séquentiellement dans de plus grandes classes jusqu'à ce qu'elles soient intégrées dans une seule et même classe.

  • Paramètres utilisés dans la boîte de dialogue de l'outil Dendrogramme :

    Fichier de signatures en entrée: isoclust12.gsg

    Fichier de dendrogramme en sortie : isodendro.txt

    Utiliser la variance dans les calculs de distance : {par défaut}

    Largeur de ligne du dendogramme : 78

Le fichier du dendrogramme se présente comme suit :

Distances between pairs of combined classes (in the sequence of merging):

Remaining   Merged   Between-Class
Class      Class      Distance
----------------------------------
  3         5        3.442680
  4         6        3.608904
  7         9        3.899360
  2         7        3.795288
  3         4        4.883098
  2         8        6.073256
  1         3        6.257798
  1         2        9.350019
----------------------------------

Dendrogram of /discb/topdir/myspace/isoclust12.gsg

C       DISTANCE
L
A
S   0      1.0     2.1     3.1     4.1     5.2     6.2     7.2     8.3     9.3
S   |-------|-------|-------|-------|-------|-------|-------|-------|------
   
   5 -------------------------|
                              |----------|
   3 -------------------------|          |
                                         |----------|
   6 ---------------------------|        |          |
                                |--------|          |-------------------|
   4 ---------------------------|                   |                   |
                                                    |                   |
   1 -----------------------------------------------|                   |
                                                                        |-
   9 -----------------------------|                                     |
                                  |                                     |
   7 ---------------------------------------------|                     |
                                   |              |                     |
   2 ------------------------------|              |---------------------|
                                                  |
   8 ---------------------------------------------|
   
    |-------|-------|-------|-------|-------|-------|-------|-------|------
    0      1.0     2.1     3.1     4.1     5.2     6.2     7.2     8.3     9.3

Rubriques connexes


Dans cette rubrique
  1. Exemple