Las funcionalidades de aprendizaje profundo están disponibles en ArcGIS Pro para imágenes y nubes de puntos a través de varias herramientas y funcionalidades.
Entrenamiento de modelos
Antes de que se pueda utilizar un modelo de aprendizaje profundo para identificar entidades u objetos en una imagen, nube de puntos u otro dataset, primero se debe entrenar para que reconozca esos objetos. El entrenamiento de un modelo de aprendizaje profundo implica muchos de los mismos pasos que al entrenar un modelo tradicional de clasificación de aprendizaje automático. Debe recopilar y proporcionar muestras de entrenamiento y datos de entrada y, a continuación, entrenar el modelo para que aprenda a reconocer esas entidades u objetos.
Preparar datos de entrenamiento
El panel Etiquetar objetos para aprendizaje profundo se utiliza para recopilar y generar datasets de imágenes etiquetados con el fin de entrenar un modelo de aprendizaje profundo para flujos de trabajo de imágenes. Puede identificar y etiquetar objetos de forma interactiva en una imagen y exportar los datos de entrenamiento como los chips de imagen, etiquetas y estadísticas necesarios para entrenar un modelo. Si tiene datos vectoriales o ráster etiquetados existentes, puede utilizar la herramienta de geoprocesamiento Exportar datos de entrenamiento para aprendizaje profundo para generar los datos de entrenamiento necesarios para el siguiente paso.
La herramienta Preparar datos de entrenamiento de nube de puntos crea datos para entrenar y validar una red neuronal convolucional para la clasificación de nube de puntos. Esta herramienta crea muchos bloques superpuestos de archivos HDF5 sin comprimir, que se utilizan para entrenar una nube de puntos. Para obtener más información sobre la preparación y el entrenamiento de datos de nube de puntos, consulte Entrenar un modelo de aprendizaje profundo para la clasificación de nube de puntos.
Entrenar un modelo
La herramienta Entrenar un modelo de aprendizaje profundo entrena un modelo de aprendizaje profundo para flujos de trabajo de imágenes utilizando datos de entrenamiento preparados. Hay varios tipos de modelo y argumentos disponibles para configurar el proceso de entrenamiento.
La herramienta Entrenar modelo de clasificación de nube de puntos entrena un modelo de aprendizaje profundo para la clasificación de nube de puntos. Para obtener más información sobre la preparación y el entrenamiento de datos de nube de puntos, consulte Entrenar un modelo de aprendizaje profundo para la clasificación de nube de puntos.
Inferencia de modelo
La inferencia del modelo hace referencia al proceso de extraer información de una imagen o nube de puntos utilizando un modelo entrenado. Las opciones para la inferencia del modelo en ArcGIS Pro son las siguientes:
- Detectar objetos: genere cuadros de delimitación alrededor de los objetos o entidades de una imagen para identificar su ubicación. Utilice la herramienta Detectar objetos con aprendizaje profundo.
- Clasificar objetos: genere etiquetas para las entidades de una imagen para identificar su clase o categoría. Utilice la herramienta Clasificar objetos con aprendizaje profundo.
- Clasificar píxeles: genere un ráster clasificado donde cada píxel pertenece a una clase o categoría. Utilice la herramienta Clasificar píxeles con aprendizaje profundo.
- Clasificar nubes de puntos: genere una nube de puntos clasificada donde los puntos se clasifican en códigos de clasificación específicos. Utilice la herramienta Clasificar nube de puntos mediante un modelo entrenado. Consulte Clasificar una nube de puntos con aprendizaje profundo para obtener más información.
Análisis exploratorio
La herramienta de análisis exploratorio Detección de objetos utiliza un modelo de aprendizaje profundo entrenado para reconocer los objetos que se muestran en el mapa o la escena actuales. Cada entidad identificada se representa mediante una entidad de punto con una ubicación en el sistema de coordenadas del mapa, atributos que detallan la orientación y la extensión del objeto y su valor de confianza. La herramienta puede trabajar con cualquier modelo Faster R-CNN entrenado, así como con los modelos YOLO, SingleShotDetector (SSD) y RetinaNet, y está diseñada para la detección a demanda de objetos en la vista activa.
Revisar los resultados
Puede revisar los resultados del modelo de aprendizaje profundo en dos fases: después de entrenar el modelo y después de ejecutar una herramienta de inferencia.
Revisar los resultados del entrenamiento del modelo
Al entrenar un modelo de aprendizaje profundo para imágenes, la salida de la herramienta Entrenar un modelo de aprendizaje profundo incluye un archivo denominado model_metric.html. Este archivo contiene información sobre su modelo entrenado, como el índice de aprendizaje, las pérdidas por entrenamiento y validación, y la puntuación de precisión media.
Al entrenar un modelo de aprendizaje profundo para nubes de puntos, la salida de la herramienta Entrenar modelo de clasificación de nube de puntos incluye resultados en la sección de mensajes de la ventana de resultados de la herramienta. El informe detallado contiene la pérdida por entrenamiento, la pérdida por validación y la precisión en cada época, así como la precisión, recuperación y f1_score del modelo de aprendizaje profundo guardado. La herramienta genera también una tabla CSV que contiene la puntuación de precisión, recuperación y F1 para cada código de clase por época. Para obtener más información sobre la revisión de los resultados de entrenamiento, consulte Evaluar los resultados de entrenamiento de nube de puntos.
Revisar los resultados de la inferencia del modelo
Después de utilizar un modelo de aprendizaje profundo, es importante revisar los resultados y evaluar la precisión del modelo.
Utilice el panel Atributos para revisar los resultados de la inferencia basada en objetos (herramienta Clasificar objetos con aprendizaje profundo o herramienta Detectar objetos con aprendizaje profundo) o del análisis exploratorio (herramienta interactiva Detección de objetos).
Puede utilizar la herramienta Calcular precisión para la detección de objetos para generar una tabla y un informe para evaluar la precisión después de efectuar la detección de objetos.