Réalisation de la classification

Disponible avec une licence Spatial Analyst.

L’objectif de la classification est d’attribuer chaque cellule de la zone d’étude à une classe connue (classification assistée) ou à un agrégat (classification non assistée). Dans les deux cas, les données intégrées à la classification consistent en un fichier de signatures contenant les statistiques multivariées de chaque classe ou agrégat. Chaque classification résulte en une carte qui fractionne la zone d’étude en classes connues, ce qui correspond à des échantillons d’entraînement, ou en classes de produisant naturellement, ce qui correspond à des agrégats définis par l’agrégation. On appelle également stratification le classement d’emplacements dans des classes se produisant naturellement correspondant à des agrégats.

Vraisemblance maximale

Dans une classe, les cellules sont rarement homogènes. Cela est particulièrement vrai dans le cas des échantillons d’entraînement extraits pour une classification non assistée. Par exemple, si des feuillus à l’ombre présentent une signature de réflectance qui ressemble à des conifères au soleil, les deux types d’arbres se retrouvent dans la même classe. Un emplacement dans un échantillon d’entraînement extrait d’un habitat supposé contenir des ours contiendrait les sous-emplacements que les ours évitent.

Dans le diagramme ci-dessous, la classe A représente les feuillus et la classe B les résineux. Comment classer une cellule appartenant à la portion superposée des deux classes ? Doit-elle appartenir à la classe A ou appartenir à la classe B ?

Superposition de classes
Superposition de classes

Pour chaque classe, l’outil de classification de vraisemblance maximale calcule la probabilité qu’une cellule appartienne à cette classe en fonction de ses valeurs attributaires. La cellule est affectée à la classe présentant la probabilité la plus élevée, d’où l’expression « vraisemblance maximale ».

Plusieurs hypothèses sont nécessaires pour que l’outil de classification de vraisemblance maximale fonctionne avec précision :

  • Les données de chaque canal doivent être distribuées normalement.
  • Chaque classe doit présenter une distribution normale dans l’espace attributaire multivarié.
  • Les probabilités a priori des classes doivent être égales. En d’autres termes, en l’absence de pondération des valeurs attributaires, toutes les classes ont la même probabilité.

Si la probabilité a priori n’est pas égale pour chaque classe d’une zone d’étude, vous pouvez pondérer les classes. Par exemple, si vous classez une image satellite de l’Alaska, les forêts et les autres types de végétation peuvent avoir une probabilité a priori plus importante que l’habitat humain. En d’autres termes, les chances qu’un emplacement de cellule contienne une maison sont bien plus faibles que les chances que la cellule contienne un type de végétation. Lorsqu’une valeur de cellule se retrouve dans la portion superposée des classes de type habitat et végétation, il y a plus de chances que l’emplacement contienne de la végétation plutôt qu’une maison, et l’emplacement doit être classé en conséquence.

Cette probabilité et cette logique de pondération reposent sur les règles de décision bayésiennes. Les valeurs de probabilité effectives de chaque cellule et de chaque classe sont déterminées à partir des moyennes et de la matrice de covariance de chaque classe (stockées dans le fichier de signatures).

Pour effectuer une classification, utilisez l’outil Classification de vraisemblance maximale. Cet outil nécessite les canaux en entrée des rasters multicanaux et des rasters spécifiques à un canal, ainsi que le fichier de signatures. Le mode de pondération des classes ou des agrégats doit être identifié. Il existe trois manières de pondérer les classes ou les agrégats : de manière égale, avec des cellules d’échantillon et avec un fichier. Lorsque la pondération s’effectue de manière égale, toutes les classes sont pondérées à l’aide de la même probabilité a priori. Lorsque la pondération s’effectue avec des cellules d’échantillon, les probabilités a priori sont proportionnelles au nombre de cellules figurant dans chaque classe ou agrégat dans le fichier de signatures. Lorsque la pondération s’effectue avec un fichier, le contrôle de saisie de fichier a priori est activé et les probabilités a priori sont lues à partir d’un fichier spécifié. Une fraction de rejet doit être identifiée. La fraction de rejet identifie la proportion des cellules qui resteront non classées en raison de la plus petite possibilité d’attributions correctes. La valeur par défaut étant 0,0, chaque cellule est classée. Il est possible d’établir une confiance facultative. Enfin, le nom de la saisie doit être spécifié.

Probabilité de classe

Plutôt que la cellule soit assignée à une classe en fonction de la probabilité la plus élevée sur un raster en sortie, l’outil Probabilité de classe génère des couches de probabilité, un canal pour chaque classe ou agrégat en entrée. Les valeurs à l’emplacement de chaque canal stockent la probabilité que cette cellule appartienne à la classe ou à l’agrégat en fonction des attributs issus des canaux en entrée d’origine.

Cette fonctionnalité peut être utile dans le scénario suivant. Imaginez que vous êtes en train de classer une image, et une classe consiste en une forêt et une autre en une zone humide. Après avoir exécuté l’outil, vous découvrez qu’une cellule dans le raster en sortie de la classe forêt reçoit une probabilité de 60 % d’appartenir à la classe forêt et, dans le raster en sortie de la classe zone humide, une probabilité de 30 % d’appartenir à la classe zone humide. Au lieu de classer l’emplacement de cellule en tant que forêt, vous pouvez le classer en tant que forêt humide.

Examen de la classification multivariée

Classification assistée

Voici les étapes à suivre pour procéder à une classification assistée :

  1. Identifiez les canaux en entrée.
  2. Produisez des échantillons d’entraînement à partir des emplacements connus des classes désirées.
  3. Développez un fichier de signatures.
  4. Si nécessaire, affichez et modifiez le fichier de signatures.
  5. Exécutez la classification.

Classification non assistée

Voici les étapes à suivre pour procéder à une classification non assistée :

  1. Identifiez les canaux en entrée.
  2. Définissez le nombre d’agrégats à créer.
  3. Développez un fichier de signatures.
  4. Si nécessaire, affichez et modifiez le fichier de signatures.
  5. Exécutez la classification.

Rubriques connexes