Cómo funciona Clasificación de máxima verosimilitud

Disponible con una licencia de Spatial Analyst.

El algoritmo que utiliza la herramienta Clasificación de máxima verosimilitud se basa en dos principios:

  • Las celdas en cada muestra de clases del espacio multidimensional que se distribuyen normalmente
  • El teorema de Bayes de toma de decisiones

La herramienta tiene en cuenta las varianzas y covarianzas de las firmas de clases cuando asigna cada celda a una de las clases representadas en el archivo de firma. Si se asume que la distribución de una muestra de clases es normal, una clase puede estar caracterizada por el vector del valor medio y la matriz de covarianza. Dadas estas dos características para cada valor de celda, se calcula la probabilidad estadística para cada clase a fin de determinar la pertenencia de las celdas a la clase. Cuando se especifica de forma predeterminada la opción Ponderación de la probabilidad a priori Igual, cada celda se asigna a la clase a la que tiene mayor probabilidad de pertenecer.

Si la probabilidad de ocurrencia de algunas clases es mayor (o menor) que el promedio, se debe usar la opción Archivo a priori con un Archivo de probabilidades a priori de entrada. Los pesos de las clases con probabilidades especiales se especifican en el archivo a priori. En este caso, un archivo a priori ayuda a asignar las celdas que se superponen estadísticamente entre dos clases. Estas celdas se asignan con mayor exactitud a la clase adecuada, dando como resultado una mejor clasificación. Este enfoque de ponderación para la clasificación se conoce como el clasificador bayesiano.

Al elegir la opción Muestra a priori, las probabilidades a priori asignadas a todas las muestras de clases en el archivo de firma de entrada son proporcionales a la cantidad de celdas capturadas en cada firma. Por consiguiente, las clases que tienen menos celdas que el promedio en la muestra reciben pesos menores que el promedio, y las que tienen más celdas reciben pesos mayores que el promedio. Como resultado, las clases respectivas tienen más o menos celdas asignadas.

Cuando se realiza una clasificación de máxima verosimilitud, también se puede producir un ráster de confianza de salida opcional. Este ráster muestra los niveles de confianza de la clasificación. La cantidad de niveles de confianza es 14, que se relaciona directamente con la cantidad de valores de fracción de rechazo válidos. El primer nivel de confianza, codificado en el ráster de confianza como 1, comprende celdas con la menor distancia hasta cualquier vector de valor medio almacenado en el archivo de firma de entrada; por lo tanto, la clasificación de estas celdas tiene una mayor certeza. Las celdas que constituyen el segundo nivel de confianza (valor de celda 2 en el ráster de confianza) se clasificarán solo si la fracción de rechazo es 0,99 o menor. El nivel de confianza más bajo tiene un valor de 14 en el ráster de confianza y muestra las celdas que posiblemente estén mal clasificadas. Las celdas de este nivel no se clasificarán cuando la fracción de rechazo sea 0,005 o mayor. Si no hay celdas clasificadas en un nivel de confianza determinado, ese nivel de confianza no estará presente en el ráster de confianza de salida.

Ejemplo

En el ejemplo siguiente se muestra cómo se utiliza la herramienta Clasificación de máxima verosimilitud para realizar una clasificación supervisada de un ráster multibanda en cinco clases de uso del suelo.

El ráster multibanda de entrada para la clasificación es una imagen de satélite de Landsat TM de cuatro bandas sin procesar del área norte de Cincinnati, Ohio.

Imagen de Landsat TM de entrada
Ejemplo de imagen de Landsat TM, con las bandas 4, 3 y 2 mostradas como una imagen en color falsa.

A partir de la imagen, se definieron cinco clases de uso del suelo en una entidad para producir las muestras de formación: Comercial/Industrial, Residencial, Tierras de cultivo, Bosque y Pastos. Se utilizó la herramienta Crear firmas para calcular las estadísticas para las clases a fin de producir un archivo de firmas.

Utilizando el ráster multibanda de entrada y el archivo de firmas, se utiliza la herramienta Clasificación de máxima verosimilitud para clasificar las celdas ráster en las cinco clases.

  • Configuraciones que se utilizan en el cuadro de diálogo de la herramienta Clasificación de máxima verosimilitud:

    Bandas de ráster de entrada: northerncincy.tif

    Archivo de firmas de entrada: signature.gsg

    Ráster multibanda de salida: landuse

    Fracción de rechazo: 0,0

    Ponderación de la probabilidad a priori: EQUAL

    Archivo de probabilidades a priori de entrada: <en blanco>

    Ráster de confianza de salida: confidence_ras

El ráster clasificado aparece como se muestra a continuación:

Mapa de uso del suelo clasificado de salida
Mapa de uso del suelo clasificado de salida.

También se creó un ráster de confianza de salida. A continuación se muestra la tabla de atributos resultante para el ráster de confianza. Muestra la cantidad de celdas clasificadas y la cantidad de confianza con la que se clasificaron. El valor 1 tiene una probabilidad de al menos el 0,995 de ser correcto. Hay 69 celdas que se clasificaron con ese nivel de confianza. El valor 5 tiene una probabilidad de al menos el 0,9, pero menos de 0,995, de ser correcto. Hubo 744.128 celdas que tuvieron una probabilidad de menos del 0,005 de ser correctas con un valor de 14.

RECORD    VALUE    COUNT
0             1       69
1             2      462
2             3     1834
3             4     1123
4             5     2044
5             6     9140
6             7    28443
7             8    46781
8             9    63234
9            10    46393
10           11    42157
11           12    54506
12           13    37937
13           14   744128

Temas relacionados


En este tema
  1. Ejemplo