Realizar la clasificación—ArcGIS Pro

Disponible con una licencia de Spatial Analyst.

El objetivo de la clasificación es asignar cada celda del área de estudio a una clase conocida (clasificación supervisada) o a un clúster (clasificación no supervisada). En ambos casos, la entrada a la clasificación es un archivo de firma que contiene las estadísticas multivariantes de cada clase o clúster. El resultado de cada clasificación es un mapa que divide el área de estudio en clases conocidas, que corresponden a muestras de entrenamiento, o clases que ocurren de forma natural, que corresponden a clústeres definidos por el clustering. La clasificación de ubicaciones en clases que ocurren de forma natural que corresponden a clústeres también se conoce como estratificación.

Máxima verosimilitud

Las celdas de una clase rara vez son homogéneas. Este es especialmente el caso de las muestras de entrenamiento que se toman para una clasificación supervisada. Si las maderas duras en la sombra, por ejemplo, tienen una firma de reflectancia similar a las coníferas a pleno sol, ambos tipos de árboles terminarán en la misma clase. Cualquier ubicación de una muestra de entrenamiento tomada de un hábitat en la que se espera encontrar osos puede contener sububicaciones que los osos evitan.

En el siguiente diagrama, la clase A representa maderas duras y la clase B representa maderas blandas. ¿Cómo clasifica una celda que cae en la superposición de las dos clases? ¿Se debe clasificar como clase A o B?

El clasificador de máxima verosimilitud calcula para cada clase la probabilidad de que la celda pertenezca a esa clase según sus valores de atributo. La celda se asigna a la clase con la probabilidad más alta, lo que resulta en el término "máxima verosimilitud".

Se necesitan varias suposiciones para que el clasificador de máxima verosimilitud funcione correctamente:

Los datos para cada banda se deben distribuir normalmente.
Cada clase debe tener una distribución normal en un espacio de atributos multivariante.
Las probabilidades previas de las clases deben ser iguales, es decir, ante la ausencia de ponderación de los valores de atributos, todas las clases tienen la misma probabilidad.

Si la probabilidad previa no es igual para cada clase de un área de estudio, puede ponderar las clases. Por ejemplo, si clasifica una imagen de satélite de Alaska, el bosque y otros tipos de vegetación podrían recibir una mayor probabilidad previa que las viviendas de personas. Es decir, la probabilidad de una ubicación de celda que contenga una vivienda es mucho menor que para que la celda contenga algún tipo de vegetación. Cuando un valor de celda cae en la parte superpuesta de las clases de tipo de vivienda y vegetación, hay más posibilidad de que la ubicación contenga vegetación en lugar de una vivienda, y la ubicación debe clasificarse en consecuencia.

Esta lógica de probabilidad y ponderación se basa en las reglas de decisión bayesiana. Los valores de probabilidad reales para cada celda y clase se determinan a partir de los valores medios y la matriz de covarianza para cada clase (que se almacenan en el archivo de firma).

Para realizar una clasificación, utilice la herramienta Clasificación de máxima verosimilitud. Esta herramienta requiere bandas de entrada de rásteres multibanda y rásteres individuales de banda única y el archivo de firma correspondiente. Se debe identificar la forma en que se ponderan las clases o los clústeres. Hay tres formas de ponderar las clases o los clústeres: igual, celdas en muestras o archivo. Cuando se elige igual, todas las clases se ponderarán con la misma probabilidad previa. Cuando se elige celdas en muestras, las probabilidades previas serán proporcionales al número de celdas de cada clase o clúster del archivo de firma. Cuando se elige el archivo, el control de entrada del archivo a priori se activa y las probabilidades previas se leen desde un archivo específico. Se debe identificar una fracción de rechazo. La fracción de rechazo identifica la parte de las celdas que permanecerá sin clasificar debido a la menor posibilidad de asignación correcta. El valor predeterminado es 0,0; por lo tanto, se clasificarán todas las celdas. Se puede crear una confianza opcional. Finalmente, se debe especificar el nombre del ráster de salida.

Probabilidad de clase

En lugar de tener la celda asignada a una clase basada en la probabilidad más alta en un ráster de salida, la herramienta Probabilidad de clase genera capas de probabilidad, una banda para cada clúster o clase de entrada. Los valores de cada ubicación para cada banda almacenan la probabilidad de que esa celda pertenezca a la clase o clúster en función de los atributos de las bandas de entrada originales.

Esta capacidad puede ser útil en la siguiente situación. Imagine que clasifica una imagen y que una clase es un bosque y otra es un humedal. Después de ejecutar la herramienta, descubre que hay una celda en el ráster de salida de la clase de bosque que recibe una probabilidad del 60 por ciento de pertenecer a la clase de bosque y, en el ráster de salida del humedal, una probabilidad del 30 por ciento de pertenecer a la clase de humedal. En lugar de clasificar la ubicación de celda como bosque, es posible que desee clasificarla como un bosque húmedo.

Revisión de la clasificación multivariante

Clasificación supervisada

Estos son los pasos para realizar una clasificación supervisada:

Identificar las bandas de entrada.
Producir muestras de entrenamiento a partir de ubicaciones conocidas de las clases deseadas.
Desarrollar un archivo de firma.
Ver y editar el archivo de firma si es necesario.
Ejecutar la clasificación.

Clasificación no supervisada

Estos son los pasos para realizar una clasificación no supervisada:

Identificar las bandas de entrada.
Definir el número de clústeres que se desea crear.
Desarrollar un archivo de firma.
Ver y editar el archivo de firma si es necesario.
Ejecutar la clasificación.

Temas relacionados

¿Algún comentario sobre este tema?