Realizar la clasificación

Disponible con una licencia de Spatial Analyst.

El objetivo de la clasificación es asignar cada celda en el área de estudio a una clase conocida (clasificación supervisada) o a un clúster (clasificación no supervisada). En ambos casos, la clasificación se realiza a través de un archivo de firma que contiene las estadísticas multivariantes de cada clase o clúster. El resultado de cada clasificación es un mapa que divide el área de estudio en clases conocidas, que corresponden a muestras de capacitación, o a clases de ocurrencia natural, que corresponden a clústeres definidos por el clustering. La clasificación de ubicaciones en clases de ocurrencia natural que correspondan a clústeres también se conoce como estratificación.

Máxima verosimilitud

Las celdas en una clase muy pocas veces son homogéneas. Esto es especialmente cierto con las muestras de capacitación que se toman para una clasificación supervisada. Si las maderas duras en la sombra, por ejemplo, tienen una característica de reflectancia similar a la de las coníferas a pleno sol, ambos tipos de árboles entrarán en la misma clasificación. Una ubicación en una muestra de capacitación de un ecosistema en donde se espera encontrar osos, mostrará algunas ubicaciones que los osos evitan.

En el siguiente diagrama, la clase A representa maderas duras y la clase B representa maderas blandas. ¿Cómo clasifica una celda que se encuentra en la superposición de las dos clases? ¿Se debe clasificar como clase A o B?

Superposición de clases
Superposición de clases

El clasificador de máxima verosimilitud calcula para cada clase la probabilidad de la celda que pertenece a esa clase según los valores de atributos. La celda se asigna a la clase con la probabilidad más alta, y resulta en el término "verosimilitud máxima".

Se necesitan algunas presuposiciones para que el clasificador de verosimilitud máxima funcione de forma exacta:

  • Los datos para cada banda se deben distribuir normalmente.
  • Cada clase debe tener una distribución normal en un espacio de atributos multivariante.
  • Las probabilidades previas de las clases deben ser iguales, es decir, ante la falta de ponderación de los valores de atributos, todas las clases serán iguales.

Si la probabilidad previa no es igual para cada clase del área de estudio, puede ponderar las clases. Por ejemplo, si clasifica una imagen satelital de Alaska, el bosque y otros tipos de vegetación recibirán una probabilidad previa mayor que las viviendas. Es decir, la probabilidad de que una ubicación de celda incluya una vivienda es mucho menor de que la celda incluya algún tipo de vegetación. Si un valor de celda cae en la parte superpuesta de las clases del tipo vivienda y vegetación, hay más posibilidades de que la ubicación incluya vegetación en vez de una vivienda, por ello, la ubicación deberá clasificarse según corresponda.

Esta lógica de probabilidad y ponderación se basa en las reglas de decisión Bayesiana. Los valores de probabilidad reales para cada celda y clase se determinan desde los medios y la matriz de covarianza de cada clase (almacenados en el archivo de firma).

Para realizar una clasificación, utilice la herramienta Clasificación de máxima verosimilitud. Esta herramienta requiere bandas de entrada de rásteres multibanda y rásteres individuales de banda única, junto con el archivo de firma correspondiente. Se debe identificar la manera en que se ponderan las clases o los clústeres. Existen tres maneras de ponderar las clases o los clústeres: igual, celdas en muestras o archivo. Cuando se elige igual, todas las clases se ponderarán con la misma probabilidad previa. Cuando se elige una celda en muestras, las probabilidades previas serán proporcionales al número de celdas en cada clase o clúster en el archivo de firma. Cuando se elige archivo, se activa el control de entrada del archivo a priori y las probabilidades previas se leen desde un archivo específico. Se debe identificar una fracción de rechazo. La fracción de rechazo identifica la porción de celdas que permanece sin clasificar por la menor posibilidad de asignación correcta. El valor predeterminado es 0,0; por lo tanto, se clasificarán todas las celdas. Se puede crear una confianza opcional. Finalmente, se debe especificar el nombre del ráster de salida.

Probabilidad de clase

En vez de tener una celda asignada a una clase basada en la probabilidad más alta en un ráster de salida, la herramienta Probabilidad de clase da como resultado capas de probabilidad, una banda para cada clúster o clase de entrada. Los valores en cada ubicación para cada banda almacenan la probabilidad de esa celda que pertenece a la clase o clúster basada en los atributos de las bandas de entrada originales.

Esta capacidad puede ser útil en la siguiente situación. Imagine que clasifica una imagen, en la que una clase es bosque y otra es humedal. Después de ejecutar la herramienta, verá que hay una celda en el ráster de salida de la clase bosque que recibe una probabilidad del 60 por ciento de pertenecer a la clase bosque, en el ráster de salida humedal, y una probabilidad del 30 por ciento de pertenecer a la clase humedal. En vez de clasificar la ubicación de la celda como bosque, la puede clasificar como un bosque húmedo.

Revisión de la clasificación multivariante

Clasificación supervisada

Los siguientes son los pasos para realizar una clasificación supervisada:

  1. Identificar las bandas de entrada.
  2. Producir muestras de capacitación desde ubicaciones conocidas de las clases deseadas.
  3. Desarrollar un archivo de firma.
  4. Ver y editar el archivo de firma de ser necesario.
  5. Llevar a cabo la clasificación.

Clasificación no supervisada

Los siguientes son los pasos para realizar una clasificación no supervisada:

  1. Identificar las bandas de entrada.
  2. Definir el número de clústeres que se deben crear.
  3. Desarrollar un archivo de firma.
  4. Ver y editar el archivo de firma de ser necesario.
  5. Llevar a cabo la clasificación.

Temas relacionados