Disponible con licencia de Image Analyst.
Disponible con una licencia de Spatial Analyst.
Todas las tareas de aprendizaje profundo supervisadas dependen de datasets etiquetados, lo que significa que las personas deben aplicar su conocimiento para entrenar la red neuronal sobre lo que trabaja para su identificación. La red neuronal utilizará los objetos etiquetados para entrenar un modelo que puede usarse para realizar inferencias sobre los datos.
La anotación de imagen, o el etiquetado, es vital para las tareas de aprendizaje profundo, como la visión y el aprendizaje informático. Se requiere una gran cantidad de datos etiquetados para entrenar un buen modelo de aprendizaje profundo. Con los datos de entrenamiento adecuados disponibles, los sistemas de aprendizaje profundo pueden ser de alta precisión en la extracción de entidades, el reconocimiento de patrones y la solución de problemas complejos. El panel Etiquetar objetos para aprendizaje profundo se puede utilizar para etiquetar datos de forma rápida y precisa.
El botón Etiquetar objetos para aprendizaje profundo se encuentra en el menú desplegable Herramientas de clasificación, en el grupo Clasificación de imagen de la pestaña Imágenes. El panel se divide en dos partes. La parte superior del panel se usa para administrar clases y la parte inferior para administrar la recogida de muestras, así como para exportar los datos de entrenamiento para los marcos de aprendizaje profundo.
Crear clases y etiquetar objetos
La parte superior del panel permite administrar clases de objetos y crear manualmente los objetos utilizados para entrenar el modelo de aprendizaje profundo. Hay muchas herramientas disponibles que le ayudarán a crear objetos etiquetados.
Herramienta | Función |
---|---|
Crear un objeto etiquetado dibujando un rectángulo alrededor de una entidad o un objeto en el ráster. | |
Crear un objeto etiquetado dibujando un polígono alrededor de una entidad o un objeto en el ráster. | |
Crear un objeto etiquetado dibujando un círculo alrededor de una entidad o un objeto en el ráster. | |
Crear un objeto etiquetado dibujando una forma a mano alzada alrededor de una entidad o un objeto en el ráster. | |
Detectar y etiquetar automáticamente la entidad u objeto. Se dibujará un polígono alrededor de la entidad u objeto. Esta herramienta solo está disponible si están instaladas las bibliotecas de marcos de aprendizaje profundo. | |
Crear una entidad seleccionando un segmento de una capa segmentada. Esta opción solo está disponible si hay una capa segmentada en el panel Contenido. Active el Selector de segmento resaltando la capa segmentada en el panel Contenido y, a continuación, seleccione la capa de la lista desplegable Selector de segmento. | |
Asigna la clase seleccionada a la imagen actual. Solo está disponible en el modo Recopilación de imágenes. | |
Seleccione y edite un objeto etiquetado. | |
Crear un esquema de clasificación. | |
Seleccione una opción de esquema de clasificación.
| |
Guarde los cambios en el esquema. | |
Guarde una nueva copia del esquema. | |
Agregar una categoría de clase al esquema. Seleccione primero el nombre del esquema para crear una clase principal en el nivel más alto. Seleccione el nombre de una clase existente para crear una subclase. | |
Elimine la clase o categoría de subclase seleccionada del esquema. |
- Haga clic en una de las herramientas de boceto como Rectángulo, Polígono, Círculo o Mano alzada, para empezar a capturar muestras de objetos.
- Mediante una herramienta de boceto, delinee la entidad de imagen que representa el objeto en el mapa.
- Si está creando una entidad sin una clase especificada, aparece el cuadro de diálogo Definir clase. Para obtener más información sobre este cuadro de diálogo, consulte la sección Definir clase.
- Siga creando y etiquetando objetos como se especifica en los pasos anteriores.
- Puede utilizar la pestaña Objetos etiquetados (en la parte inferior del panel) para eliminar y organizar las muestras de objetos etiquetados.
- Cuando esté conforme con todos los objetos etiquetados, guarde sus muestras haciendo clic en el botón Guardar en la pestaña Objetos etiquetados.
Ahora que ha etiquetado manualmente una muestra representativa de los objetos, estos se pueden utilizar para exportar los datos de entrenamiento.
Detección automática
La herramienta Detección automática se utiliza para dibujar automáticamente un rectángulo alrededor de una entidad; haga clic en la entidad y se dibujará un cuadro de delimitación rectangular. Si desea un límite de polígono de la entidad, mantenga presionada la tecla Mayús y haga clic en la entidad; se dibujará un perímetro alrededor de la forma de la entidad. Para que la herramienta funcione bien, requiere que se visualice un número significativo de píxeles de las entidades en el mapa, por lo que deberá acercarse más a las entidades.
Detección automática funciona bien en distintos casos de entidades. No se recomienda si tiene entidades continuas muy próximas entre sí.
Definir clase
El cuadro de diálogo Definir clase le permite crear una nueva clase o definir una clase existente. Si elige Utilizar la clase existente, seleccione la opción Nombre de clase apropiada para ese objeto. Si elige Agregar nueva clase, opcionalmente puede editar la información y hacer clic en Aceptar para crear la nueva clase.
Etiquetar colecciones de imágenes
Si tiene una colección de imágenes y desea etiquetarlas, primero debe crear un dataset de mosaico o una capa de mosaico con la función Rásteres de mosaico. A continuación, utilice el dataset de mosaico o la capa de mosaico para etiquetar cada una de las imágenes. La pestaña Recopilación de imágenes muestra la lista desplegable de imágenes. La imagen seleccionada se dibujará en el mapa. A continuación, puede etiquetar la imagen con la clase adecuada. Utilice los botones de flecha para elegir la siguiente imagen que desee ver y etiquetar.
Cuando su imagen está en un Sistema de coordenadas de imagen (ICS), la imagen puede tener una orientación inusual, especialmente cuando se trata de imágenes oblicuas o de perspectiva. Para ver su imagen en un espacio de píxeles, active la casilla de verificación Etiqueta en espacio de píxeles. Así, se dibujará la imagen en una orientación más propicia para la interpretación de imágenes intuitiva.
Etiquetar toda la imagen
En el caso de instancias en las que no desee dibujar un límite alrededor de un objeto, puede utilizar el botón Etiquetar imagen para etiquetar toda la imagen con la clase seleccionada, independientemente del aspecto espacial del objeto.
Objetos etiquetados
La pestaña Objetos etiquetados se encuentra en la sección inferior del panel y administra las muestras de entrenamiento que se han capturado para cada clase. Recopile sitios representativos, o muestras de entrenamiento, para cada clase de la imagen. Una muestra de entrenamiento tiene información de ubicación (de polígono) y una clase asociada. El algoritmo de clasificación de imágenes usa las muestras de entrenamiento, guardadas como clase de entidad, para identificar las clases de cobertura de suelo en toda la imagen.
Puede ver y administrar muestras de entrenamiento agregándolas, agrupándolas o eliminándolas. Cuando seleccione una muestra de entrenamiento, se selecciona en el mapa. Haga doble clic en una muestra de entrenamiento de la tabla para acercarla en el mapa.
Herramienta | Función |
---|---|
Abrir una clase de entidad de muestras de entrenamiento existente. | |
Guardar las ediciones realizadas en la clase de entidad de objetos etiquetados actual. | |
Guardar los objetos etiquetados actuales como una nueva clase de entidad. | |
Eliminar los objetos etiquetados seleccionados. |
Exportar datos de entrenamiento
Una vez recopiladas las muestras, puede exportarlas a datos de entrenamiento haciendo clic en la pestaña Exportar datos de entrenamiento. A continuación, los datos de entrenamiento se pueden usar en un modelo de aprendizaje profundo. Una vez rellenados los parámetros, haga clic en Ejecutar para crear los datos de entrenamiento.
Parámetro | Descripción |
---|---|
Carpeta de salida | Elija la carpeta de salida en la que se guardarán los datos de entrenamiento. |
Entidades poligonales de máscara | Una clase de entidad poligonal que delinea el área en la que se crearán los chips de imagen. Solo se crean los chips de imagen que recaen completamente dentro de los polígonos. |
Formato de imagen | Especifica el formato de ráster para las salidas de chips de imagen.
Los formatos PNG y JPEG admiten hasta tres bandas. |
Tamaño de tesela X | El tamaño de los chips de imagen para la dimensión x. |
Tamaño de tesela Y | El tamaño de los chips de imagen para la dimensión y. |
Paso X | La distancia a la que se desplaza la dirección x al crear los siguientes chips de imagen. Cuando el paso equivale al tamaño de la tesela, no habrá ninguna superposición. Cuando el paso equivale a la mitad del tamaño de la tesela, habrá una superposición del 50 por ciento. |
Paso Y | La distancia a la que se desplaza la dirección y al crear los siguientes chips de imagen. Cuando el paso equivale al tamaño de la tesela, no habrá ninguna superposición. Cuando el paso equivale a la mitad del tamaño de la tesela, habrá una superposición del 50 por ciento. |
Ángulo de rotación | El ángulo de rotación que se utilizará para generar chips de imagen adicionales. Se genera un chip de imagen con un ángulo de rotación de 0, lo que significa ninguna rotación. A continuación, se girará en el ángulo especificado para crear un chip de imagen adicional. Las mismas muestras de entrenamiento se capturan en múltiples ángulos de múltiples chips de imágenes para el aumento de datos. El ángulo de rotación predeterminado es 0. |
Salida de teselas sin entidades | Especifica si se exportarán los chips de imagen que no capturen muestras de entrenamiento.
|
Formato de metadatos | Especifica el formato que se utilizará para las etiquetas de metadatos de salida. Si los datos de muestra de entrenamiento de entrada son una capa de clase de entidad, como por ejemplo una capa de edificios o un archivo de muestra de entrenamiento de clasificación estándar, utilice la opción Etiquetas KITTI o PASCAL Visual Object Classes (KITTI_rectangles o PASCAL_VOC_rectangles en Python). Los metadatos de salida son un archivo .txt o un archivo .xml que contiene los datos de muestra de entrenamiento incluidos en el rectángulo mínimo de delimitación. El nombre del archivo de metadatos coincide con el nombre de la imagen de origen de entrada. Si los datos de muestra de entrenamiento de entrada son un mapa de clase, utilice la opción Teselas clasificadas (Classified_Tiles en Python) como formato de metadatos de salida.
El formato de metadatos KITTI permite 15 columnas, pero solo se utilizan 5 de ellas en la herramienta. La primera columna es el valor de clase. Las siguientes 3 columnas se omiten. Las columnas 5 a 8 definen el rectángulo mínimo de delimitación, que consta de cuatro ubicaciones de coordenada de imagen: píxeles izquierdo, superior, derecho e inferior. El rectángulo mínimo de delimitación comprende el chip de formación utilizado en el clasificador de aprendizaje profundo. Las columnas restantes no se utilizan. |
Oscurecer alrededor de entidad | Especifica si se ocultarán los píxeles situados alrededor de cada objeto o entidad de cada tesela de imagen.
Este parámetro solo se aplica si el parámetro Formato de metadatos tiene el valor Teselas etiquetadas y se ha especificado una clase de entidad de entrada o un ráster clasificado. |
Modo de cultivo | Especifica si las teselas exportadas se deben recortar de forma que todas tengan el mismo tamaño.
Este parámetro solo se aplica si el parámetro Formato de metadatos tiene el valor Teselas etiquetadas o bien ImageNet y se ha especificado una clase de entidad de entrada o un ráster clasificado. |
Sistema de Referencia | Especifica el tipo de sistema de referencia que se utilizará para interpretar la imagen de entrada. El sistema de referencia especificado debe coincidir con el sistema de referencia utilizado para entrenar el modelo de aprendizaje profundo.
|
Ráster de entrada adicional | Una fuente adicional de imágenes de entrada para los métodos de traslación de imágenes. Este parámetro es válido cuando el parámetro Formato de metadatos se establece en Teselas clasificadas, Teselas de exportación o CycleGAN. |
Los datos de entrenamiento exportados ahora se pueden usar en un modelo de aprendizaje profundo.