Réalisation de la classification

Disponible avec une licence Spatial Analyst.

La classification a pour objectif d'attribuer chaque cellule de la zone d'étude à une classe connue (classification assistée) ou à un agrégat (classification non assistée). Dans les deux cas, l'entrée dans la classification est un fichier de signatures contenant les statistiques multivariées de chaque classe ou agrégat. Le résultat de chaque classification est une carte qui partitionne la zone d'étude en classes connues, lesquelles sont associées à des échantillons d'apprentissage ou à des classes naturelles correspondant à des agrégats définis par l'agrégation. La classification d'emplacements en classes naturelles correspondant à des agrégats est également désignée sous le nom de "stratification".

Vraisemblance maximale

Les cellules appartenant à une classe sont rarement homogènes. Cela est particulièrement vrai pour des échantillons d'apprentissage utilisés dans une classification assistée. Par exemple, si des feuillus situés dans l'ombre ont une signature de réflexion qui ressemble à celle des conifères en plein soleil, les deux types d'arbre finiront par appartenir à la même classe. Tout emplacement d'un échantillon d'apprentissage tiré d'un habitat où vous vous attendez à trouver des ours pourrait aussi bien contenir des sous-emplacements évités par les ours.

Dans le diagramme ci-dessous, la classe A représente des feuillus et la classe B des conifères. Comment classeriez-vous une cellule qui se situe dans la superposition des deux classes ? Devrait-elle appartenir à la classe A ou B ?

Superposition de classes
Superposition de classes

Le classificateur de vraisemblance maximale calcule, pour chaque classe, la probabilité d'appartenance de la cellule à cette classe, en fonction de ses valeurs attributaires. La cellule est attribuée à la classe ayant la plus haute probabilité, d'où l’expression "vraisemblance maximale".

Plusieurs conditions doivent être remplies pour que le classificateur de vraisemblance maximale fonctionne correctement.

  • Les données de chaque canal doivent être réparties normalement.
  • Chaque classe doit avoir une répartition normale dans un espace attributaire multivarié.
  • Les probabilités précédentes des classes doivent être égales, c'est-à-dire qu'en l'absence de valeur attributaire de pondération, toutes les classes ont la même probabilité de vraisemblance.

Si la probabilité précédente n'est pas la même pour chaque classe de la zone d'étude, vous pouvez pondérer les classes. Par exemple, si vous classez une image satellite de l'Alaska, les forêts et autres types de végétation devraient avoir une probabilité a priori supérieure à celle des habitations humaines. Autrement dit, la probabilité d'un emplacement de cellule contenant une habitation est bien inférieure à celle de la cellule contenant un certain type de végétation. Lorsqu'une valeur de cellule se situe dans la partie superposée des classes d'habitation et de type de végétation, les chances que l'emplacement contienne un certain type de végétation plutôt qu'une habitation sont plus élevées, et l'emplacement devra être classé conséquemment.

Cette logique de probabilité et de pondération repose sur les règles de décision bayésiennes. Les valeurs de probabilité réelle pour chaque cellule et classe sont déterminées d'après la matrice de moyenne et de covariance pour chaque classe (stockée dans le fichier de signatures).

Pour effectuer une classification, utilisez l’outil Classification de vraisemblance maximale. Cet outil nécessite des canaux d'entrée de raster multicanaux et raster monocanaux individuels et le fichier de signatures correspondant. Le mode de pondération des classes ou des agrégats doit être identifié. Il y existe trois façons de pondérer les classes ou les agrégats : équivalence, cellules dans les exemples ou fichier. Si l'option de probabilité égale est sélectionnée, toutes les classes sont pondérées avec la même probabilité a priori. Lorsque l'option des cellules des échantillons est sélectionnée, les probabilités a priori sont proportionnelles au nombre de cellules de chaque classe ou agrégat dans le fichier de signatures. Lorsque l'option de fichier est sélectionnée, le contrôle en entrée du fichier a priori est activé, et les probabilités a priori sont lues depuis le fichier défini. Une fraction de rejet doit être identifiée. La fraction de rejet identifie la proportion des cellules qui resteront non classées en raison de la plus petite possibilité d'attribution correcte. La valeur par défaut est 0,0 (chaque cellule est classée). Un niveau de confiance facultatif peut être défini. Enfin, le nom du raster en sortie doit être défini.

Probabilité de classe

Au lieu que la cellule soit attribuée à une classe en fonction de la probabilité la plus grande dans un raster en sortie, l’outil Probabilité de classe génère des couches de probabilités, une couche étant attribuée à chaque classe ou agrégat en entrée. Les valeurs à chaque emplacement d’un canal stockent la probabilité d'appartenance de cette cellule à la classe ou à l'agrégat, en fonction des canaux en entrée d'origine.

Cette fonctionnalité peut s'avérer utile dans les situations suivantes. Supposons que vous classiez une image, et que l'une des classes représente une forêt et une autre un marécage. Après avoir utilisé l’outil Probabilité de classe, vous constatez que l'une des cellules du raster en sortie de classe de forêt reçoit une probabilité d'appartenance à la classe de forêt égale à 60 %, et dans le raster en sortie de marécage, une probabilité d'appartenance à la classe de marécage égale à 30 %. Au lieu de classer l'emplacement de cellule sous forêt, il serait peut-être préférable de la classer en tant que marécage.

Récapitulatif sur la classification multivariée

Classification assistée

Voici les étapes à suivre pour effectuer une classification assistée :

  1. Identifiez les canaux en entrée.
  2. Produire des échantillons d'apprentissage à partir d'emplacements connus des classes souhaitées.
  3. Créer un fichier de signatures.
  4. Afficher et modifier le fichier de signatures, le cas échéant.
  5. Effectuer la classification.

Classification non assistée

Voici les étapes à suivre pour effectuer une classification non assistée :

  1. Identifiez les canaux en entrée.
  2. Définir le nombre total d'agrégats qui seront créés.
  3. Créer un fichier de signatures.
  4. Afficher et modifier le fichier de signatures, le cas échéant.
  5. Effectuer la classification.

Rubriques connexes