Fundamentos de la detección interactiva de objetos

Disponible con una licencia Advanced.

Disponible con licencia de Image Analyst.

La detección interactiva de objetos se utiliza para buscar objetos de interés a partir de imágenes mostradas en una escena.

La detección de objetos se basa en un modelo de aprendizaje profundo que se ha entrenado para detectar objetos específicos en una imagen, por ejemplo, ventanas y puertas de edificios en una escena. Los resultados de la detección se guardan automáticamente en una clase de entidad de puntos con una puntuación de confianza, dimensiones del cuadro de delimitación y el nombre de la etiqueta como atributos.

Esta herramienta requiere la instalación de las bibliotecas de aprendizaje profundo antes de ejecutarla.

Licencia:

La herramienta de detección de objetos interactivos requiere una licencia de ArcGIS Pro Advanced o la extensión ArcGIS Image Analyst.

Las siguientes imágenes ilustran el resultado de la detección de objetos devuelto con las diferentes opciones de simbología.

Detección interactiva de objetos mediante simbología de caja

Detección interactiva de objetos mediante simbología de puntos de ubicación

Detectar objetos en una vista 3D

La herramienta Detección de objetos Detección de objetos está disponible en el menú desplegable Análisis 3D exploratorio del grupo Flujos de trabajo de la pestaña Análisis. Después de seleccionar la herramienta Detección de objetos, aparece el panel Análisis exploratorio. Utilice el panel Análisis exploratorio para modificar o aceptar los parámetros de detección de objetos y establecer qué método de cámara determina cómo se ejecuta la herramienta para los resultados de detección. La primera vez que se ejecuta la herramienta, el modelo se carga y se calculan las detecciones. Las ejecuciones adicionales no requieren volver a cargar el modelo y tardarán menos tiempo. Si cambia la selección del modelo, necesitará de nuevo el tiempo de carga inicial.

Propiedades de detección de objetos

Las propiedades para la detección de objetos se describen en la siguiente tabla:

OpciónDescripción

Modelo

Paquete de aprendizaje profundo (.dlpk) que se va a utilizar para detectar objetos. Entre los tipos de modelos admitidos se encuentran FasterRCNN, YOLOv3, Single Shot Detector (SSD) y RetinaNet.

Expanda la flecha desplegable de entrada de Modelo y haga clic en Descargar para obtener automáticamente el modelo Esri Windows y Doors preentrenado. Opcionalmente, haga clic en Examinar para elegir un paquete de aprendizaje profundo local o descargarlo desde ArcGIS Online.

Clases

La lista de objetos del mundo real que se van a detectar. La lista se rellena desde el archivo .dlpk. El valor predeterminado es Todo.

Nivel mínimo de confianza

La puntuación de detección mínima que debe cumplir una detección. Las detecciones con puntuaciones inferiores a este nivel se descartan. El valor predeterminado es 0,5.

Umbral máximo de superposición

La intersección sobre el umbral de combinación con otras detecciones. Si los resultados de detección se superponen, el que tenga la puntuación más alta se considera un positivo verdadero. El valor predeterminado es 0.

Procesar mediante GPU

Utilice la potencia de procesamiento de la unidad de procesamiento de gráficos (GPU) en lugar de la potencia de procesamiento de la unidad de procesamiento del equipo (CPU). Se recomienda si tiene una tarjeta gráfica muy buena con al menos 8 Gb de memoria GPU dedicada.

Capa de entidades

Nombre de la capa de entidades de salida.

  • Si la capa no existe, se crea una clase de entidad en la geodatabase predeterminada del proyecto y se agrega al mapa o la escena actuales.
  • Si la capa ya está en la vista y tiene el esquema requerido, los objetos recién detectados se incorporan a la clase de entidad existente.
  • Si vuelve a ejecutar la herramienta cuando la capa no está en el mapa o la escena actuales, se crea una nueva clase de entidad con nombre único en la geodatabase predeterminada y se agrega a la vista.

Descripción

La descripción que se incluirá en la tabla de atributos. Es posible guardar varios resultados de detección en la misma capa de entidades y se puede utilizar una descripción para diferenciar entre estas varias detecciones.

Simbología

Establezca la forma devuelta de la capa de entidades de salida utilizando el color predeterminado Oro electrón. Las opciones de simbología son:

  • Punto de ubicación: una X que marca el punto central de la entidad. Esta es la opción predeterminada.
  • Cuadro de delimitación vertical (solo 3D): un cuadro de delimitación vertical relleno y semitransparente. Utilice la simbología de cuadro de delimitación vertical en escenas para modelos de aprendizaje profundo que detecten objetos verticales, como ventanas y puertas.
  • Cuadro de delimitación horizontal (solo 3D): un cuadro de delimitación horizontal relleno y semitransparente. Utilice la simbología de cuadro de delimitación horizontal en escenas para modelos de aprendizaje profundo que detecten objetos horizontales, por ejemplo, piscinas.

Si la capa de salida ya está en la vista y tiene simbología personalizada, su simbología no se modifica cuando se ejecuta la herramienta.

Distancia

Defina la distancia máxima desde la cámara a la que se conservarán los resultados. Se ignorará todo lo que esté más allá de la profundidad establecida.

Ancho

Defina los valores de ancho mínimo y máximo para el tamaño del resultado devuelto.

Altura

Defina los valores de altura mínima y máxima para el tamaño del resultado esperado devuelto.

Nota:
Los parámetros Distancia, Ancho y Altura se encuentran dentro de la sección Resultados del filtro, que es posible que deba expandir para establecer estos valores.

Métodos de detección de objetos

Los métodos para la detección de objetos se describen en la siguiente tabla:

MétodoDescripción

Cámara actual Cámara actual

Este es el método de creación predeterminado. Utiliza la posición actual de la cámara para detectar objetos.

Reposicionar cámara Reposicionar cámara (solo 3D)

Reposiciona la cámara en un punto de visualización horizontal o vertical antes de detectar objetos. Configure el punto de visualización del área de interés y utilícelo para ajustar la alineación. No se recomienda para posicionar la cámara en objetos en la distancia para acercarlos a la vista.

Actualizar los resultados de detección

Para cambiar los resultados de salida, por ejemplo, utilizando un valor de confianza diferente o eligiendo otra área de interés, cambie esas propiedades y ejecute de nuevo la herramienta Detección de objetos. El objeto recién descubierto se incorporará a la misma capa. También puede proporcionar un nuevo nombre y crear otra capa de entidades de salida para compararla. No se recomienda actualizar manualmente los valores de atributo de los resultados de la detección de objetos. También puede expandir la sección Resultados de filtro para especificar los valores de tamaño y distancia a fin de ajustar con precisión los resultados devueltos.

Sugerencia:

Antes de volver a ejecutar la herramienta, desactive la visibilidad de la capa para los resultados de detección anteriores. De lo contrario, esos resultados pueden superponerse a objetos detectados y podrían afectar a los resultados de la detección.

Eliminar los resultados de detección

Los resultados de detección se agregan como entidades de puntos. Como tal, puede eliminar entidades individuales utilizando los flujos de trabajo de edición estándar. Como alternativa, elimine toda la clase de entidad de la geodatabase predeterminada del proyecto. Al eliminar la capa del panel Contenido no se eliminan automáticamente los resultados, ya que siguen existiendo en la geodatabase. Si vuelve a ejecutar la herramienta cuando la capa no está en el mapa o la escena actuales, se crea una nueva clase de entidad con nombre único en la geodatabase predeterminada y se agrega a la vista.

Temas relacionados