Objetos etiquetados para aprendizaje profundo

Disponible con licencia de Image Analyst.

Disponible con una licencia de Spatial Analyst.

Todas las tareas de aprendizaje profundo supervisadas dependen de datasets etiquetados, lo que significa que las personas deben aplicar su conocimiento para entrenar la red neuronal sobre lo que trabaja para su identificación. La red neuronal utilizará los objetos etiquetados para entrenar un modelo que puede usarse para realizar inferencias sobre los datos.

La anotación de imagen, o el etiquetado, es vital para las tareas de aprendizaje profundo, como la visión y el aprendizaje informático. Se requiere una gran cantidad de datos etiquetados para entrenar un buen modelo de aprendizaje profundo. Con los datos de entrenamiento adecuados disponibles, los sistemas de aprendizaje profundo pueden ser de alta precisión en la extracción de entidades, el reconocimiento de patrones y la solución de problemas complejos. El panel Etiquetar objetos para aprendizaje profundo se puede utilizar para etiquetar datos.

El botón Etiquetar objetos para aprendizaje profundo Etiquetar objetos para aprendizaje profundo se encuentra en el menú desplegable Herramientas de aprendizaje profundo, en el grupo Clasificación de imagen de la pestaña Imágenes. Una vez iniciada la herramienta, elija si desea utilizar una capa existente o crear una colección de imágenes. Para una nueva colección de imágenes, vaya a la ubicación de su carpeta de imágenes y se creará una capa con su colección de imágenes.

Una vez especificada la ubicación de la colección de imágenes, aparece el panel Etiquetar objetos. El panel se divide en dos partes. La parte superior del panel sirve para administrar clases y la parte inferior para administrar la recogida de muestras, así como para exportar los datos de entrenamiento para los marcos de aprendizaje profundo.

Crear clases y etiquetar objetos

La parte superior del panel permite administrar clases de objetos y crear manualmente los objetos utilizados para entrenar el modelo de aprendizaje profundo. Hay muchas herramientas disponibles que le ayudarán a crear objetos etiquetados.

HerramientaFunción
New Rectangle

Crear un objeto etiquetado dibujando un rectángulo alrededor de una entidad o un objeto en el ráster.

New Polygon

Crear un objeto etiquetado dibujando un polígono alrededor de una entidad o un objeto en el ráster.

New Circle

Crear un objeto etiquetado dibujando un círculo alrededor de una entidad o un objeto en el ráster.

New Lasso Area

Crear un objeto etiquetado dibujando una forma a mano alzada alrededor de una entidad o un objeto en el ráster.

Detección automática

Detectar y etiquetar automáticamente la entidad u objeto. Se dibujará un polígono alrededor de la entidad u objeto.

Esta herramienta solo está disponible si están instaladas las bibliotecas de marcos de aprendizaje profundo.

Seleccionar por polígono

Crear una entidad seleccionando un segmento de una capa segmentada. Esta opción solo está disponible si hay una capa segmentada en el panel Contenido. Active el Selector de segmento resaltando la capa segmentada en el panel Contenido y, a continuación, seleccione la capa de la lista desplegable Selector de segmento.

Imagen de etiqueta

Asigna la clase seleccionada a la imagen actual.

Solo está disponible en el modo Recopilación de imágenes.

Editar

Seleccione y edite un objeto etiquetado.

Nueva plantilla

Crear un esquema de clasificación.

Examinar

Elija una opción de esquema de clasificación.

  • Ir a un esquema existente.
  • Generar un nuevo esquema a partir de una clase de entidad de muestra de entrenamiento existente.
  • Generar un nuevo esquema a partir de un ráster clasificado existente.
  • Utilice el esquema predeterminado de la base de datos nacional de cobertura de suelo de 2011.

Guardar

Guarde los cambios en el esquema.

Guardar ediciones

Guarde una nueva copia del esquema.

Agregar

Agregar una categoría de clase al esquema. Seleccione primero el nombre del esquema para crear una clase principal en el nivel más alto. Seleccione el nombre de una clase existente para crear una subclase.

Eliminar elementos seleccionados

Elimine la clase o categoría de subclase seleccionada del esquema.

  1. Haga clic en una de las herramientas de boceto como Rectángulo, Polígono, Círculo o Mano alzada, para empezar a capturar muestras de objetos.
  2. Mediante una herramienta de boceto, delinee la entidad de imagen que representa el objeto en el mapa.
    1. Si está creando una entidad sin una clase especificada, aparece el cuadro de diálogo Definir clase. Para obtener más información sobre este cuadro de diálogo, consulte la sección Definir clase.
  3. Siga creando y etiquetando objetos como se especifica en los pasos anteriores.
  4. Puede utilizar la pestaña Objetos etiquetados (en la parte inferior del panel) para eliminar y organizar las muestras de objetos etiquetados.
  5. Cuando esté conforme con todos los objetos etiquetados, guarde sus muestras haciendo clic en el botón Guardar Guardar en la pestaña Objetos etiquetados.

Ahora que ha etiquetado manualmente una muestra representativa de los objetos, estos se pueden utilizar para exportar los datos de entrenamiento.

Detección automática

La herramienta Detección automática Detección automática se utiliza para dibujar automáticamente un rectángulo alrededor de una entidad; haga clic en la entidad y se dibujará un cuadro de delimitación rectangular. Si desea un límite de polígono de la entidad, mantenga presionada la tecla Mayús y haga clic en la entidad; se dibujará un perímetro alrededor de la forma de la entidad. Para que la herramienta funcione bien, requiere que se visualice un número significativo de píxeles de las entidades en el mapa, por lo que deberá acercarse más a las entidades.

Detección automática funciona bien en distintos casos de entidades. No se recomienda si tiene entidades continuas muy próximas entre sí.

Definir clase

El cuadro de diálogo Definir clase le permite crear una clase o definir una clase existente. Si elige Utilizar la clase existente, elija la opción Nombre de clase apropiada para ese objeto. Si elige Agregar nueva clase, opcionalmente puede editar la información y hacer clic en Aceptar para crear la clase.

Etiquetar colecciones de imágenes

Si tiene una colección de imágenes y desea etiquetarlas, utilice el dataset de mosaico o la capa mosaico para etiquetar cada una de las imágenes. La pestaña Recopilación de imágenes muestra la lista desplegable de imágenes. La imagen seleccionada se dibujará en el mapa. A continuación, puede etiquetar la imagen con la clase adecuada. Utilice los botones de flecha para elegir la siguiente imagen que desee ver y etiquetar.

Cuando su imagen está en un Sistema de coordenadas de imagen (ICS), la imagen puede tener una orientación inusual, especialmente cuando se trata de imágenes oblicuas o de perspectiva. Para ver su imagen en un espacio de píxeles, active la casilla de verificación Etiqueta en espacio de píxeles. Así, se dibujará la imagen en una orientación más propicia para la interpretación de imágenes intuitiva.

Etiquetar toda la imagen

En el caso de instancias en las que no desee dibujar un límite alrededor de un objeto, puede utilizar el botón Etiquetar imagen Imagen de etiqueta para etiquetar toda la imagen con la clase seleccionada, independientemente del aspecto espacial del objeto.

Objetos etiquetados

La pestaña Objetos etiquetados se encuentra en la sección inferior del panel y administra las muestras de entrenamiento que se han capturado para cada clase. Recopile sitios representativos, o muestras de entrenamiento, para cada clase de la imagen. Una muestra de entrenamiento tiene información de ubicación (de polígono) y una clase asociada. El algoritmo de clasificación de imágenes usa las muestras de entrenamiento, guardadas como clase de entidad, para identificar las clases de cobertura de suelo en toda la imagen.

Puede ver y administrar muestras de entrenamiento agregándolas, agrupándolas o eliminándolas. Cuando seleccione una muestra de entrenamiento, se selecciona en el mapa. Haga doble clic en una muestra de entrenamiento de la tabla para acercarla en el mapa.

HerramientaFunción
Examinar

Abrir una clase de entidad de muestras de entrenamiento existente.

Guardar

Guardar las ediciones realizadas en la clase de entidad de objetos etiquetados actual.

Guardar ediciones

Guardar los objetos etiquetados actuales como una nueva clase de entidad.

Eliminar elementos seleccionados

Eliminar los objetos etiquetados seleccionados.

Exportar datos de entrenamiento

Una vez recopiladas las muestras, puede exportarlas a datos de entrenamiento haciendo clic en la pestaña Exportar datos de entrenamiento. A continuación, los datos de entrenamiento se pueden usar en un modelo de aprendizaje profundo. Una vez rellenados los parámetros, haga clic en Ejecutar para crear los datos de entrenamiento.

ParámetroDescripción

Carpeta de salida

Elija la carpeta de salida en la que se guardarán los datos de entrenamiento.

Entidades poligonales de máscara

Una clase de entidad poligonal que delinea el área en la que se crearán los chips de imagen.

Solo se crean los chips de imagen que recaen completamente dentro de los polígonos.

Formato de imagen

Especifica el formato de ráster para las salidas de chips de imagen.

  • TIFF. Esta es la opción predeterminada.
  • MRF (formato de metarráster).
  • PNG.
  • JPEG.

Los formatos PNG y JPEG admiten hasta tres bandas.

Tamaño de tesela X

El tamaño de los chips de imagen para la dimensión x.

Tamaño de tesela Y

El tamaño de los chips de imagen para la dimensión y.

Paso X

La distancia a la que se desplaza la dirección x al crear los siguientes chips de imagen.

Cuando el paso equivale al tamaño de la tesela, no habrá ninguna superposición. Cuando el paso equivale a la mitad del tamaño de la tesela, habrá una superposición del 50 por ciento.

Paso Y

La distancia a la que se desplaza la dirección y al crear los siguientes chips de imagen.

Cuando el paso equivale al tamaño de la tesela, no habrá ninguna superposición. Cuando el paso equivale a la mitad del tamaño de la tesela, habrá una superposición del 50 por ciento.

Ángulo de rotación

El ángulo de rotación que se utilizará para generar chips de imagen adicionales. Se genera un chip de imagen con un ángulo de rotación de 0, lo que significa ninguna rotación. A continuación, se girará en el ángulo especificado para crear un chip de imagen adicional. Las mismas muestras de entrenamiento se capturan en múltiples ángulos de múltiples chips de imágenes para el aumento de datos. El ángulo de rotación predeterminado es 0.

Salida de teselas sin entidades

Especifica si se exportarán los chips de imagen que no capturen muestras de entrenamiento.

  • Desactivado: solo se exportarán los chips de imagen que capturen muestras de entrenamiento. Esta es la opción predeterminada.
  • Activado: se exportarán todos los chips de imagen, incluidos aquellos que no capturen muestras de entrenamiento.

Formato de metadatos

Especifica el formato que se utilizará para las etiquetas de metadatos de salida.

Si los datos de muestra de entrenamiento de entrada son una capa de clase de entidad, como por ejemplo una capa de edificios o un archivo de muestra de entrenamiento de clasificación estándar, utilice la opción Etiquetas KITTI o PASCAL Visual Object Classes (KITTI_rectangles o PASCAL_VOC_rectangles en Python). Los metadatos de salida son un archivo .txt o un archivo .xml que contiene los datos de muestra de entrenamiento incluidos en el rectángulo mínimo de delimitación. El nombre del archivo de metadatos coincide con el nombre de la imagen de origen de entrada. Si los datos de muestra de entrenamiento de entrada son un mapa de clase, utilice la opción Teselas clasificadas (Classified_Tiles en Python) como formato de metadatos de salida.

  • Etiquetas KITTI: los metadatos siguen el mismo formato que el dataset de evaluación de detección de objetos del Instituto Tecnológico de Karlsruhe y el Instituto Tecnológico de Toyota (KITTI). El dataset KITTI es un conjunto de referencia de visión. Los archivos de etiquetas son archivos de texto plano. Todos los valores, tanto numéricos como de cadena de caracteres, se separan con espacios y cada fila se corresponde con un objeto.
  • PASCAL Visual Object Classes: los metadatos siguen el mismo formato que el dataset Pattern Analysis, Statistical Modeling and Computational Learning, Visual Object Classes (PASCAL_VOC). El dataset PASCAL VOC es un dataset de imágenes estandarizado para el reconocimiento de clases de objetos. Los archivos de etiquetas son archivos XML que contienen información sobre el nombre de la imagen, el valor de clase y cuadros de delimitación. Esta es la opción predeterminada.
  • Teselas clasificadas: la salida será un chip de imagen clasificado por cada chip de imagen de entrada. No se utiliza ningún otro metadato para cada chip de imagen. Solo el resultado de las estadísticas tiene más información sobre las clases, como los nombres de las clases, los valores de las clases y las estadísticas de salida.
  • Máscaras RCNN: la salida serán chips de imagen con una máscara en las áreas donde existe la muestra. El modelo genera cuadros de delimitación y máscaras de segmentación para cada instancia de un objeto de la imagen. Se basa en Feature Pyramid Network (FPN) y una base ResNet101 en el modelo de marco de aprendizaje profundo.
  • Teselas etiquetadas: cada tesela de salida se etiqueta con una clase específica. Si elige este formato de metadatos, también puede refinar los parámetros Oscurecer alrededor de entidad y Modo de cultivo.
  • Teselas multietiquetas: cada tesela de salida se etiqueta con una o varias clases. Por ejemplo, una tesela puede etiquetarse como agricultura y también como nublado. Este formato se utiliza para la clasificación de objetos.
  • Exportar teselas: la salida serán chips de imagen sin etiqueta. Este formato se utiliza para técnicas de traslación de imágenes, como Pix2Pix y Superresolución.
  • CycleGAN: la salida serán chips de imagen sin etiqueta. Este formato se utiliza para la técnica de traslación de imágenes CycleGAN, que se utiliza para entrenar imágenes que no se solapan.
  • ImageNet: cada tesela de salida se etiqueta con una clase específica. Este formato se usa para la clasificación de objetos; sin embargo, también se puede usar para realizar un rastreo de objetos cuando se usa el tipo de modelo de Orden profundo durante el entrenamiento.

El formato de metadatos KITTI permite 15 columnas, pero solo se utilizan 5 de ellas en la herramienta. La primera columna es el valor de clase. Las siguientes 3 columnas se omiten. Las columnas 5 a 8 definen el rectángulo mínimo de delimitación, que consta de cuatro ubicaciones de coordenada de imagen: píxeles izquierdo, superior, derecho e inferior. El rectángulo mínimo de delimitación comprende el chip de formación utilizado en el clasificador de aprendizaje profundo. Las columnas restantes no se utilizan.

Oscurecer alrededor de entidad

Especifica si se ocultarán los píxeles situados alrededor de cada objeto o entidad de cada tesela de imagen.

  • Desactivado: los píxeles que rodean a los objetos o entidades no se ocultan. Esta es la opción predeterminada.
  • Activado: los píxeles que rodean a los objetos o entidades se ocultan.

Este parámetro solo se aplica si el parámetro Formato de metadatos tiene el valor Teselas etiquetadas y se ha especificado una clase de entidad de entrada o un ráster clasificado.

Modo de cultivo

Especifica si las teselas exportadas se deben recortar de forma que todas tengan el mismo tamaño.

  • Tamaño fijo: las teselas exportadas tendrán el mismo tamaño y se centrarán en la entidad. Esta es la opción predeterminada.
  • Cuadro de delimitación: las teselas exportadas se recortarán de forma que la geometría de delimitación rodee solo a la entidad en la tesela.

Este parámetro solo se aplica si el parámetro Formato de metadatos tiene el valor Teselas etiquetadas o bien ImageNet y se ha especificado una clase de entidad de entrada o un ráster clasificado.

Sistema de Referencia

Especifica el tipo de sistema de referencia que se usará para interpretar la imagen de entrada. El sistema de referencia especificado debe coincidir con el sistema de referencia utilizado para entrenar el modelo de aprendizaje profundo.

  • Espacio de mapa: la imagen de entrada se encuentra en un sistema de coordenadas basado en un mapa. Esta es la opción predeterminada.
  • Espacio de píxeles: la imagen de entrada está en el espacio de imagen (filas y columnas), sin rotación ni distorsión.

Ráster de entrada adicional

Una fuente adicional de imágenes de entrada para los métodos de traslación de imágenes.

Este parámetro es válido cuando el parámetro Formato de metadatos se establece en Teselas clasificadas, Teselas de exportación o CycleGAN.

Los datos de entrenamiento exportados ahora se pueden usar en un modelo de aprendizaje profundo.

Temas relacionados