Disponible con licencia de Image Analyst.
Disponible con una licencia de Spatial Analyst.
Clasificar una imagen
La herramienta Clasificar permite elegir entre las técnicas de clasificación no supervisadas o supervisadas para clasificar píxeles u objetos en un dataset ráster. Para visualizar la herramienta Clasificar, seleccione el ráster que se va a clasificar en el panel Contenido y, a continuación, en la pestaña Imágenes, haga clic en la flecha desplegable Herramientas de clasificación.
Para la clasificación supervisada, debe proporcionar un archivo de ejemplos para el entrenamiento. Puede crear ejemplos de entrenamiento utilizando el Administrador de muestras de entrenamiento de la lista desplegable Herramientas de clasificación, o bien puede proporcionar un archivo de ejemplos de entrenamiento existente. Estos archivos pueden ser shapefiles o clases de entidad que contengan las muestras de entrenamiento. Los siguientes nombres de campo son obligatorios en el archivo de muestra de entrenamiento:
- classname- un campo de texto que indique el nombre de la categoría de clase
- classvalue- Un campo de tipo entero largo que contenga el valor entero para cada categoría de clase
Para el análisis de imágenes basado en objetos, debe proporcionar una imagen segmentada. Puede crear una imagen segmentada utilizando la herramienta Segmentación de la lista desplegable Herramientas de clasificación.
Existen cinco Clasificadores disponibles para clasificar los datos:
- Cluster ISO: el clasificador de cluster ISO realiza una clasificación no supervisada. Este clasificador puede procesar imágenes segmentadas muy grandes, cuya tabla de atributos puede ser grande. Además, la herramienta acepta un ráster de RGB segmentado procedente de una aplicación de terceros. La herramienta funciona con archivos ráster estándar compatibles con Esri, así como con datasets ráster segmentados.
- Máxima verosimilitud: el clasificador de máxima verosimilitud es una técnica tradicional para la clasificación de imágenes. Se basa en dos principios: la distribución normal de los píxeles de cada muestra de clase en el espacio multidimensional y el teorema de Bayes para la toma de decisiones.
- Árboles aleatorios: el clasificador de árboles aleatorios es una potente técnica para la clasificación de imágenes que resiste el exceso de ajuste y que puede funcionar con imágenes segmentadas y con otros datasets ráster auxiliares. Para las entradas de imagen estándar, la herramienta acepta imágenes multibanda con cualquier profundidad de bit y realiza la clasificación de árboles aleatorios por píxel, según el archivo de entidades de la formación de entrada.
- Máquina de vectores de soporte (SVM): el clasificador de SVM proporciona un potente método de clasificación supervisada que permite tratar una entrada de ráster segmentado o una imagen estándar. Es menos susceptible al ruido, a las bandas correlacionadas y al desequilibrio entre la cantidad o el tamaño de los sitios de formación dentro de cada clase. Se trata de un método de clasificación cuyo uso está muy extendido entre los investigadores.
- Entrenar K vecino más cercano: el clasificador de K vecino más cercano es un método de clasificación no paramétrico que clasifica un píxel o segmento por un voto de pluralidad de sus vecinos. K es el número de vecinos utilizados en la votación.
Los tipos de clasificadores disponibles en la herramienta Clasificación de imagen se describen a continuación.
Cluster ISO
Realice una clasificación no supervisada utilizando el algoritmo de clúster ISO, que determina las características de los grupos naturales de celdas en un espacio de atributos multidimensional.
Nombre del parámetro | Descripción |
---|---|
Número máximo de clases | Número máximo de clases deseadas para agrupar píxeles o segmentos. Se debe definir basándose en el número de clases de la leyenda. Puede que obtenga menos clases que las que especificó para este parámetro. Si necesita más, aumente este valor y agregue clases una vez que finalice el proceso de formación. |
Número máximo de iteraciones | Número máximo de iteraciones para ejecutar el proceso de clustering. El rango recomendado está entre 10 y 20 iteraciones. Al aumentar este valor, el tiempo de procesamiento aumentará linealmente. |
Número máximo de fusiones de clúster por iteración | El número máximo de veces que se puede fusionar un cluster. Si se aumenta la cantidad de fusiones, se reducirá la cantidad de clases que se crean. Un valor más bajo generará más clases. |
Distancia máxima de fusión | Si se aumenta la distancia se podrán fusionar más clusters y se obtendrán menos clases. Un valor más bajo generará más clases. La distancia es espectral por naturaleza y se basa en el color RGB. Por ejemplo, la distancia entre un píxel con un valor RGB de 100, 100, 100 tiene una distancia de 50 desde un píxel con un valor RGB de 100, 130, 120. Aunque puede asignarle cualquier valor, los valores entre 0 y 5 suelen ofrecer los mejores resultados. |
Número mínimo de muestras por clúster | Número mínimo de píxeles o segmentos en un cluster o clase válidos. Se ha demostrado que el valor predeterminado de 20 es efectivo a la hora de crear clases significativas desde el punto de vista estadístico. Puede aumentar este número para obtener clases más robustas; sin embargo, puede que esto limite el número global de clases que se crean. |
Factor de omisión | Número de píxeles a ignorar para una entrada de imagen de píxeles. Si una imagen segmentada es una entrada, especifique el número de segmentos a ignorar. |
Imagen segmentada | Si lo desea, incorpore una imagen segmentada para realizar la clasificación basada en objetos. |
Atributos de segmento | Cuando use una imagen segmentada, podrá elegir los atributos de la imagen segmentada que se deben utilizar:
|
Dataset clasificado de salida | Elija el nombre y la ubicación de salida para la salida clasificada. |
Archivo de definición clasificado de salida | Se trata de un archivo JSON que contiene información de atributos, estadísticas, vectores de hiperplano y otra información necesaria para el clasificador. Se crea un archivo con la extensión .ecd. |
Máxima probabilidad
Realice una clasificación de máxima verosimilitud, que se basa en dos principios: la distribución normal de los píxeles de cada muestra de clase en el espacio multidimensional y el teorema de Bayes para la toma de decisiones.
Nombre del parámetro | Descripción |
---|---|
Muestras de entrenamiento | Seleccione el archivo de muestra de entrenamiento o la capa que delinea los sitios de formación. Estos pueden ser shapefiles o clases de entidad que contengan las muestras de formación. |
Imagen segmentada | Si lo desea, incorpore una imagen segmentada para realizar la clasificación basada en objetos. |
Atributos de segmento | Cuando use una imagen segmentada, podrá elegir los atributos de la imagen segmentada que se deben utilizar:
|
Dataset clasificado de salida | Elija el nombre y la ubicación de salida para la salida clasificada. |
Archivo de definición clasificado de salida | Se trata de un archivo JSON que contiene información de atributos, estadísticas, vectores de hiperplano y otra información necesaria para el clasificador. Se crea un archivo con la extensión .ecd. |
Árboles aleatorios
Lleve a cabo una clasificación de árboles aleatorios, que usa varios árboles de decisión adiestrados usando pequeñas variaciones de los mismos datos de entrenamiento. Cuando se clasifica una muestra, el voto mayoritario de esos árboles formados decide la clase de salida. Este conjunto de árboles es menos vulnerable al exceso de ajuste que un único árbol.
Nombre del parámetro | Descripción |
---|---|
Muestras de entrenamiento | Seleccione el archivo de muestra de entrenamiento o la capa que delinea los sitios de formación. Estos pueden ser shapefiles o clases de entidad que contengan las muestras de formación. |
Número máximo de árboles | El número máximo de árboles en el bosque. Al aumentar el número de árboles se obtendrán tasas de precisión más elevadas aunque, al final, esta mejora se estabiliza. El número de árboles aumenta el tiempo de procesamiento de forma lineal. |
Profundidad máxima de árbol | La profundidad máxima de cada árbol del bosque. La profundidad es otra forma de indicar la cantidad de reglas que puede crear cada árbol para llegar a una decisión. Los árboles no profundizarán más allá de este valor. |
Número máximo de muestras por clase | El número máximo de muestras que se van a utilizar para definir cada clase. Se recomienda un valor predeterminado de 1000 cuando las entradas son rásteres no segmentados. Un valor igual o menor que 0 significa que el sistema siempre utilizará todas las muestras de los sitios de formación para preparar el clasificador. |
Imagen segmentada | Si lo desea, incorpore una imagen segmentada para realizar la clasificación basada en objetos. |
Atributos de segmento | Cuando use una imagen segmentada, podrá elegir los atributos de la imagen segmentada que se deben utilizar:
|
Dataset clasificado de salida | Elija el nombre y la ubicación de salida para la salida clasificada. |
Archivo de definición clasificado de salida | Se trata de un archivo JSON que contiene información de atributos, estadísticas, vectores de hiperplano y otra información necesaria para el clasificador. Se crea un archivo con la extensión .ecd. |
Máquina de vectores de soporte
Lleve a cabo una clasificación de máquina de vectores de soporte que asigne los vectores de datos de entrada a un espacio de entidades con más dimensiones para separar de un modo óptimo los datos en las distintas clases. Las máquinas de vectores de soporte pueden gestionar imágenes muy grandes y son menos susceptibles al ruido, a las bandas correlacionadas y al desequilibrio en el número o el tamaño de los sitios de entrenamiento dentro de cada clase.
Nombre del parámetro | Descripción |
---|---|
Muestras de entrenamiento | Seleccione el archivo de muestra de entrenamiento o la capa que delinea los sitios de formación. Estos pueden ser shapefiles o clases de entidad que contengan las muestras de formación. |
Número máximo de muestras por clase | El número máximo de muestras que se van a utilizar para definir cada clase. Se recomienda un valor predeterminado de 500 cuando las entradas son rásteres no segmentados. Un valor igual o menor que 0 significa que el sistema siempre utilizará todas las muestras de los sitios de formación para preparar el clasificador. |
Imagen segmentada | Si lo desea, incorpore una imagen segmentada para realizar la clasificación basada en objetos. |
Atributos de segmento | Cuando use una imagen segmentada, podrá elegir los atributos de la imagen segmentada que se deben utilizar:
|
Dataset clasificado de salida | Elija el nombre y la ubicación de salida para la salida clasificada. |
Archivo de definición clasificado de salida | Se trata de un archivo JSON que contiene información de atributos, estadísticas, vectores de hiperplano y otra información necesaria para el clasificador. Se crea un archivo con la extensión .ecd. |
K vecino más cercano
Lleve a cabo un método de clasificación no paramétrico que clasifica un píxel o segmento por medio de un voto por pluralidad de sus vecinos. K es el número de vecinos utilizados en la votación.
Nombre del parámetro | Descripción |
---|---|
Muestras de entrenamiento | Seleccione el archivo de muestra de entrenamiento o la capa que delinea los sitios de formación. Estos pueden ser shapefiles o clases de entidad que contengan las muestras de formación. |
Campo de valor de dimensión | Contiene valores de dimensión de la clase de entidad de muestra de entrenamiento de entrada. Este parámetro es necesario para clasificar una serie temporal de datos ráster con la salida ráster de análisis de cambios de la herramienta Analizar cambios usando CCDC. |
K vecinos más cercanos | La cantidad de vecinos que se utilizará para buscar cada píxel o segmento de entrada. Aumentar la cantidad de vecinos disminuirá la influencia de vecinos individuales en el resultado de la clasificación. El valor predeterminado es 1. |
Número máximo de muestras por clase | El número máximo de muestras de entrenamiento que se utilizarán para definir cada clase. Se recomienda el valor predeterminado de 1000 cuando las entradas son rásteres no segmentados. Un valor igual o menor que 0 significa que el sistema siempre utilizará todas las muestras de los sitios de formación para preparar el clasificador. |
Imagen segmentada | Si lo desea, incorpore una imagen segmentada para realizar la clasificación basada en objetos. |
Atributos de segmento | Cuando use una imagen segmentada, podrá elegir los atributos de la imagen segmentada que se deben utilizar:
|
Dataset clasificado de salida | Elija el nombre y la ubicación de salida para la salida clasificada. |
Archivo de definición clasificado de salida | Se trata de un archivo JSON que contiene información de atributos, estadísticas, vectores de hiperplano y otra información necesaria para el clasificador. Se crea un archivo con la extensión .ecd. |
Métodos adicionales para la clasificación y el reconocimiento de patrones
La caja de herramientas de Image Analyst contiene métodos adicionales para la clasificación y el reconocimiento de patrones, los cuales se describen a continuación.
- Clasificar ráster con espectro: clasifica un dataset ráster multibanda mediante técnicas de coincidencia espectral, según el ángulo vectorial o la divergencia de información espectral entre la imagen de entrada y el perfil espectral de referencia. Las salidas son el ráster clasificado de salida, el archivo de definición de clasificador de salida (.ecd) y el ráster de puntuación de salida. El Ráster de puntuación de salida es un ráster multibanda que almacena los resultados coincidentes para cada miembro final.
- Entrenar modelo de regresión de árboles aleatorios: modela la relación entre variables explicativas (variables independientes) y un dataset de destino (variable dependiente). La herramienta se puede utilizar para entrenar con una variedad de tipos de datos. Los rásteres de entrada (variables explicativas) pueden ser un ráster o una lista de rásteres, una banda única o multibanda en la que cada banda es una variable explicativa, un ráster multidimensional en el que las variables del ráster son las variables explicativas o una combinación de tipos de datos.
Las salidas son:
- una tabla que contiene información que describe la importancia de cada variable explicativa utilizada en el modelo
- gráficos de dispersión de datos de entrenamiento, datos de prueba y datos de prueba de ubicación
- la definición de regresión (.ecd) que contiene información de atributos, estadísticas u otra información para el clasificador
- Predecir con modelo de regresión: predice valores de datos con la salida de la herramienta Entrenar modelo de regresión de árboles aleatorios. La salida es un ráster de los valores predichos.
Temas relacionados
- Función Clasificar
- Clasificar ráster
- Preparar clasificador de clúster ISO
- Preparar clasificador de máxima verosimilitud
- Preparar clasificador de árboles aleatorios
- Preparar clasificador de máquina de vectores de soporte
- Generar muestras de entrenamiento a partir de puntos de semillas
- Inspeccionar muestras para formación
- Función Segmentación desplazamiento medio
- Función Clasificar ML
- Información sobre la segmentación y la clasificación
- Entrenar modelo de regresión de árboles aleatorios
- Predecir con modelo de regresión