Revisar etiquetas y datos de entrenamiento

Disponible con licencia de Image Analyst.

Disponible con una licencia de Spatial Analyst.

La calidad de los datos de entrenamiento es importante a la hora de entrenar un modelo de aprendizaje profundo. ArcGIS Pro incluye herramientas que permiten a los usuarios revisar, aprobar, rechazar y actualizar sus etiquetas o datos de entrenamiento exportados. Estas herramientas pueden realizar tanto una revisión manual visual como una revisión automatizada basada en evaluaciones cuantitativas.

Pestaña Etiqueta

Una vez etiquetados los objetos, se puede realizar una revisión manual de control de calidad (QA) para comprobar si hay errores de etiquetado. La pestaña Etiqueta contiene herramientas para revisar, aprobar, rechazar y editar etiquetas. En el proceso de control de calidad participan dos tipos de usuarios:

  • Revisores: estos revisores solo pueden aprobar o rechazar etiquetas.
  • Editores: estos editores pueden aprobar, rechazar y editar etiquetas.

Las herramientas de la pestaña Etiqueta pueden ser utilizadas tanto por revisores como por editores y se describen en la siguiente tabla:

HerramientaDescripción

Cargar muestras de formación

Cargar muestras de formación

Abra una clase de entidad de muestra de entrenamiento existente para consultarla.

Guardar

Guardar

Guarde las ediciones en la clase de entidad actual.

Guardar como

Guardar como

Guarde las ediciones en una nueva clase de entidad.

Aprobar

Aprobar

Apruebe las etiquetas seleccionadas.

Rechazar

Rechazar

Rechace las etiquetas seleccionadas.

Eliminar

Eliminar

Elimine las etiquetas seleccionadas.

Editar

Editar

Edite la forma de las muestras de entrenamiento seleccionadas.

La parte inferior del panel muestra todos los registros de la clase de entidad de las etiquetas, en forma de tabla. Cada etiqueta tiene un nombre de clase, el estado actual y cualquier problema del que se haya informado como se indica a continuación:

  • Nombre de clase: enumera cada etiqueta por sus nombres de clase. Se puede modificar el nombre de cada clase y agregar nuevos.
  • Estado: muestra el estado actual de las etiquetas en el proceso de consulta. De forma predeterminada, el estado de todas las etiquetas es Pendiente. Un revisor puede cambiar el estado a Aprobado o Rechazado.
  • Problema: enumera la razón por la que se rechazó una etiqueta durante el proceso de consulta. Cuando se rechaza una etiqueta, el revisor selecciona el motivo por el que se ha rechazado. Las opciones son Etiqueta incorrecta y Estado deficiente.

Nota:

Cuando se seleccionan una o varias filas en la tabla, el mapa se acerca a la etiqueta para que sea más fácil consultarla. Es especialmente útil cuando se seleccionan varias etiquetas para consultarlas.

Pestaña Datos

Una vez que los objetos han sido etiquetados y los datos de entrenamiento han sido exportados, se puede realizar una revisión de control de calidad. La pestaña Datos ofrece herramientas para consultar rápidamente los errores de las etiquetas y los chips de imágenes exportados. La galería muestra el nombre de la clase y un cuadro delimitador para cada chip de imagen. En esta etapa, los revisores evalúan la calidad de los datos de entrenamiento exportados para garantizar que satisfagan las necesidades del proyecto. Pueden producirse algunos problemas, como chips de imagen demasiado grandes o demasiado pequeños, etiquetas que faltan, etiquetas parciales o falta de superposición. Cuando se selecciona una miniatura de un chip de imágenes, se muestra a tamaño completo en la ventana Vista previa situada debajo de la galería.

Nota:

Actualmente, la pestaña Datos solo admite datos de entrenamiento procedentes de la detección de objetos.

Las herramientas de la pestaña Datos se describen en la siguiente tabla:

HerramientaDescripción

Cargar datos de formación

Cargar datos de formación

Cargar datos de formación de una carpeta.

Clase

Lista desplegable Clase

Seleccione la clase para filtrar los datos de formación.

Controles de reproducción

Controles de reproducción

Los controles de navegación y reproducción le permiten desplazarse por los chips de imágenes exportados junto con sus etiquetas correspondientes. Solo se muestran 20 chips de imágenes a la vez en la galería, pero las herramientas de navegación controlan qué chips de imágenes ver.

  • El botón Reproducir Reproducir muestra todos los chips de imágenes en secuencia.
  • El botón Pausa Pausa pausa la reproducción.
  • La lista desplegable Velocidad Lista de control de velocidad controla la velocidad de reproducción. Las opciones de velocidad disponibles son 0,5x, 1x, 2x y 3x.
  • Para las consultas manuales, utilice los botones Primero Primero, Anterior Anterior, Siguiente Siguiente o Último Último para navegar hasta un conjunto de imágenes de la lista.

Saltar a

Saltar a

Navegue a una imagen específica. Introduzca el número de la imagen en el cuadro de texto y haga clic en el botón Saltar a.

Pestaña Revisión automática

En el caso de datasets grandes, la revisión manual puede llevar mucho tiempo y resultar ineficaz. Las herramientas de la pestaña Revisión automática se pueden utilizar para evaluar rápidamente la calidad de las etiquetas comparándolas con pequeños datos realidad del terreno.

Detectar etiquetas de objetos

La pestaña Revisión automática evalúa automáticamente las etiquetas de detección de objetos utilizando datos de realidad del terreno. La herramienta genera un conjunto de métricas de veracidad, entre las que se incluyen objetos comunes en contexto (COCO), precisión media (mAP) y una curva de precisión-recuperación, para proporcionar una evaluación de la calidad de los datos. Mediante el uso de la relación IoU (intersección sobre combinación), identifica y cuenta los verdaderos y falsos positivos y negativos, generando un informe detallado con todas las métricas clave necesarias para evaluar el conjunto de datos.

En la tabla siguiente se enumeran los parámetros asociados a la pestaña Revisión automática para la detección de objetos:

ParámetroDescripción

Etiquetas

Clase de entidad poligonal que contiene los objetos detectados de la herramienta Detectar objetos con aprendizaje profundo.

Características de realidad del terreno

Clase de entidad poligonal que contiene datos de realidad del terreno.

Tabla de veracidad de salida

Tabla de precisión de salida.

Informe de veracidad de salida

Nombre del informe de precisión de salida. El informe es un documento PDF que contiene métricas y gráficos de precisión.

Campo de valor de clase detectado

Campo de la clase de entidad de objetos detectados que contiene los valores de clase o los nombres de clase.

Si no se proporciona ningún nombre de campo, se utilizará un campo Classvalue o Value. Si estos campos no existen, se identificará que todos los registros pertenecen a una sola clase.

Los nombres de clase o los valores de clase deben coincidir exactamente con los de la clase de entidad de referencia del terreno.

Campo de valor de clase de realidad del terreno

Campo de la clase de entidad de realidad del terreno que contiene los valores de clase.

Si no se proporciona ningún nombre de campo, se utilizará un campo Classvalue o Value. Si estos campos no existen, se identificará que todos los registros pertenecen a una sola clase.

Los nombres de clase o valores de clase deben coincidir exactamente con los de la clase de entidad de objetos detectados.

Mínimo de intersección sobre combinación (IoU)

Relación IoU que se utilizará como umbral para evaluar la precisión del modelo de detección de objetos. El numerador es el área de superposición entre el cuadro de delimitación previsto y el cuadro de delimitación de referencia del terreno. El denominador es el área de unión o el área abarcada por ambos cuadros de delimitación. Los rangos IoU varían de 0 a 1.

Entidades de máscara

Clase de entidad poligonal que delinea el área o las áreas en la que se calculará la precisión. Solo se evaluará la precisión de las entidades que intersequen la máscara.

Etiquetas de clasificación de píxeles

La pestaña Revisión automática evalúa automáticamente las etiquetas de clasificación de píxeles utilizando datos de realidad del terreno. La herramienta calcula una matriz de confusión basada en errores de omisión y comisión y, a continuación, deriva la puntuación de IoU. La veracidad se calcula entre las etiquetas y los datos de realidad del terreno; las etiquetas pueden ser una clase de entidad o una capa ráster.

En la tabla siguiente se enumeran los parámetros asociados a la pestaña Revisión automática para la clasificación de píxeles:

ParámetroDescripción

Etiquetas

El ráster clasificado de entrada.

Datos de realidad del terreno

La imagen de clasificación de entrada u otros datos de referencia SIG temáticos. La entrada puede ser un ráster o una clase de entidades.

Los datos típicos son una imagen de clasificación de una sola banda del tipo de datos enteros.

Al usar polígonos como entrada, utilice solo aquellos no empleados como muestras de referencia. También pueden ser datos SIG de cobertura de suelo en formato shapefile o de clase de entidad.

Matriz de confusión de salida

El nombre del archivo de salida de la matriz de confusión en formato de tabla.

El formato de la tabla está determinado por la ubicación y la ruta de salida. De forma predeterminada, la salida será una tabla de geodatabase. Si la ruta no está en una geodatabase, especifique una la extensión .dbf para guardarla en formato dBASE.

Número de puntos aleatorios

El número total de puntos aleatorios que se generarán.

El número real puede superar este número, nunca quedar por debajo, dependiendo de la estrategia de muestreo y el número de clases. El número predeterminado de puntos generados de manera aleatoria es 500.

Estrategia de muestreo

Especifica el esquema de muestreo que se utilizará.

  • Aleatorio estratificado: se crearán puntos distribuidos aleatoriamente en cada clase, de modo que cada clase tenga un número de puntos proporcional a su área relativa.

  • Aleatorio estratificado ecualizado: se crearán puntos distribuidos aleatoriamente en cada clase, de modo que cada clase tenga el mismo número de puntos.
  • Aleatorio: se crearán puntos distribuidos aleatoriamente por toda la imagen.

Distancia mínima entre puntos

Distancia mínima entre los puntos de referencia.

Temas relacionados