Fonctionnement de l'outil Classification de vraisemblance maximale

Disponible avec une licence Spatial Analyst.

L’algorithme utilisé par l’outil Classification de vraisemblance maximale repose sur deux principes :

  • Les cellules dans chaque exemple de classe dans l'espace multidimensionnel sont réparties normalement
  • Le théorème de Bayes de prise de décision

L'outil tient compte à la fois des moyennes et des covariances des signatures de classe lors de l'attribution de chaque cellule à l'une des classes représentées dans le fichier de signatures. En supposant que la distribution d'un exemple de classe est normale, une classe peut être caractérisée par le vecteur moyen et la matrice de covariance. Compte tenu de ces deux caractéristiques pour chaque valeur de cellule, la probabilité statistique est calculée pour chaque classe. Elle permet de connaître l'appartenance des cellules en fonction de la classe. Lorsque le paramètre par défaut Equal (Égal) est spécifié pour l’option A priori probability weighting (Pondération de probabilité a priori), chaque cellule est affectée à la classe dont elle est le plus susceptible d’être membre.

Lorsque la probabilité de quelques classes est supérieure (ou inférieure) à la moyenne, vous devez utiliser l’option a priori File (Fichier) avec Input a priori probability file (Fichier de probabilité a priori en entrée). Les pondérations des classes avec les probabilités spéciales sont spécifiées dans ce fichier. Dans ce cas, un fichier a priori permet d'attribuer des cellules qui figurent dans la superposition entre deux classes. Ces cellules sont affectées plus correctement à la classe appropriée pour obtenir une meilleure classification. Cette pondération relève de la méthode bayésienne.

Lorsque vous choisissez l’option a priori Sample (Échantillon), les probabilités associées aux classes échantillonnées dans le fichier de signatures sont proportionnelles au nombre de cellules associées à chaque signature. Par conséquent, les classes qui ont moins de cellules que la moyenne dans l'exemple reçoivent des pondérations au-dessous de la moyenne. Celles qui ont plus de cellules reçoivent des pondérations supérieures à la moyenne. En conséquence, ces classes sont associées à plus ou moins de cellules.

Lorsqu'une classification de probabilité maximale est effectuée, vous pouvez également obtenir un raster de confiance en sortie facultatif. Ce raster affiche les niveaux de confiance de classification. Le nombre de niveaux de confiance est 14, mis directement en rapport avec le nombre de valeurs de la fraction des rebuts autorisés. Le premier niveau de confiance (codé dans un raster 1) comprend des cellules dont la distance la plus courte par rapport au vecteur moyen est enregistrée dans le fichier de signatures. La pertinence de la classification de ces cellules est donc optimale. Les cellules qui comprennent le deuxième niveau de confiance seraient classées (valeur de la cellule 2 dans le raster de confiance) uniquement si la fraction du rebut est 0,99 ou inférieure. Le niveau de confiance le plus bas a une valeur de 14 sur le raster de confiance. Il affiche les cellules qui seraient très probablement incorrectement classées. À ce stade, les cellules ne sont pas classées lorsque la fraction est de 0,005 ou plus. Si aucune cellule n’est classé à un niveau de confiance donné, ce niveau de confiance est absent du raster de confiance en sortie.

Exemple

L’exemple suivant montre comment l’outil de classification de la vraisemblance maximale est utilisé pour effectuer une classification supervisée d’un raster multicanal en cinq classes d’utilisation du sol.

Le raster multicanal en entrée pour la classification est une image satellite Landsat TM à quatre canaux de la région nord de Cincinnati, Ohio.

Image Landsat TM en entrée
Un exemple d’image Landsat TM, avec les canaux 4, 3 et 2 affichés comme fausses images couleur.

À partir de l'image, cinq classes d'utilisation du sol ont été définies dans une classe d'entités pour produire les échantillons de formation : Commercial / Industrial (Zone commerciale/industrielle), Residential (Zone résidentielle), Cropland (Terre d'assolement), Forest (Forêt) et Pasture (Pâturage). L'outil Créer des signatures a été utilisé pour calculer les statistiques des classes afin de produire un fichier de signature.

À l'aide du raster multicanal en entrée et du fichier de signature, l'outil Classification de vraisemblance maximale est utilisé pour classer les cellules raster en cinq classes.

  • Paramètres utilisés dans la boîte de dialogue de l'outil Classification de vraisemblance maximale :

    Canaux raster en entréenortherncincy.tif

    Fichier de signature en entrée filesignature.gsg

    Raster multicanal en sortieutilisation du sol

    Fraction de rebut0.0

    Pondération de probabilité a priori : EGAL

    Fichier de probabilité à priori en entrée : <vierge>

    Raster de confiance en sortieconfidence_ras

Le raster classé apparaît comme indiqué :

Carte d’utilisation du sol classée en sortie
Carte d’utilisation du sol classée en sortie.

Un raster de confiance a également été créé. Voici la table attributaire résultante pour le raster de confiance. Elle indique le nombre de cellules classées selon le degré de confiance. La valeur 1 a une probabilité d'au moins 0,995 d'être exacte. Il existe 69 cellules classées avec ce niveau de confiance. La valeur 5 a une probabilité d'au moins 0,9 mais inférieure à 0,995 d'être exacte. 744 128 cellules avaient une probabilité de moins 0,005 d'être correctes avec une valeur de 14.

RECORD    VALUE    COUNT
0             1       69
1             2      462
2             3     1834
3             4     1123
4             5     2044
5             6     9140
6             7    28443
7             8    46781
8             9    63234
9            10    46393
10           11    42157
11           12    54506
12           13    37937
13           14   744128

Rubriques connexes


Dans cette rubrique
  1. Exemple