Examiner les étiquettes et les données d’entraînement

Disponible avec une licence Image Analyst.

Disponible avec une licence Spatial Analyst.

La qualité des données d’entraînement est importante lors de l’entraînement d’un modèle de Deep Learning. ArcGIS Pro inclut des outils qui permettent aux utilisateurs d’examiner, d’approuver, de rejeter et de mettre à jour vos étiquettes ou données d’entraînement exportées. Ces outils peuvent effectuer à la fois une vérification manuelle visuelle et une vérification automatisée en fonction des évaluations quantitatives.

Onglet Label (Étiquette)

Une fois que les objets ont été étiquetés, une assurance qualité (QA) manuelle peut être effectuée pour rechercher les éventuelles erreurs d’étiquetage. L’onglet Label (Étiquette) contient des outils permettant d’examiner, d’approuver, de rejeter et de mettre à jour des étiquettes. Deux types d’utilisateurs sont impliqués dans le traitement d’assurance qualité :

  • Reviewers : ces réviseurs peuvent uniquement approuver ou rejeter des étiquettes.
  • Editors : ces éditeurs peuvent approuver, rejeter et mettre à jour des étiquettes.

Les outils de l’onglet Label (Étiquette) peuvent être utilisés par les réviseurs et les éditeurs, et sont présentés dans le tableau ci-dessous :

OutilDescription

Charger des échantillons d’entraînement

Charger des échantillons d’entraînement

Ouvrir une classe d’entités d’échantillon d’entraînement pour examen.

Enregistrer

Enregistrer

Enregistrer les mises à jour apportées à la classe d’entités actuelle.

Enregistrer sous

Enregistrer sous

Enregistrer les mises à jour apportées à une nouvelle classe d’entités.

Approuver

Approuver

Approuver les étiquettes sélectionnées.

Refuser

Refuser

Refuser les étiquettes sélectionnées.

Suppr

Suppr

Supprimer les étiquettes sélectionnées.

Modifier

Modifier

Mettre à jour la forme de l’échantillon d’entraînement sélectionné.

La partie inférieure du volet affiche tous les enregistrements de la classe d’entités d’étiquette dans un tableau. Chaque étiquette contient un nom, l’état en cours et tous les problèmes qui peuvent avoir été signalés, comme suit :

  • Class Name (Nom de classe) : dresse la liste des étiquettes en fonction de leur nom de classe. Chaque nom de classe peut être modifié et de nouveaux noms de classe peuvent être ajoutés.
  • Status (État) : présente l’état en cours des étiquettes dans le processus de révision. Par défaut, l’état de toutes les étiquettes est défini sur Pending (En attente). Un réviseur peut remplacer l’état par Approved (Approuvé) ou Rejected (Refusé).
  • Issue (Problème) : dresse la liste des raisons pour lesquelles une étiquette a été refusée lors du processus de révision. Lorsqu’une étiquette est refusée, le réviseur sélectionne la raison pour laquelle elle l’a été. Les choix possibles sont Wrong label (Étiquette incorrecte) et Poor shape (Forme médiocre).

Remarque :

Si au moins une ligne est sélectionnée dans la table, la carte zoome sur l’étiquette de manière à faciliter la révision. Cela est particulièrement utile lorsque plusieurs étiquettes sont sélectionnées pour la révision.

Onglet Data (Données)

Une fois que les objets ont été étiquetés et que les données d’entraînement ont été exportées, une vérification d’assurance qualité peut être effectuée. L’onglet Data (Données) fournit les outils permettant de procéder à un examen visuel rapide des erreurs dans les étiquettes et les fragments d’image exportés. La bibliothèque affiche le nom de classe et une emprise pour chaque fragment d’image. À ce stade, les réviseurs évaluent la qualité des données d’entraînement exportées pour s’assurer qu’elles répondent bien aux besoins du projet. Plusieurs problèmes peuvent se produire et notamment des fragments d’image trop grands ou trop petits, des étiquettes manquantes, des étiquettes partielles ou un manque de superposition. Lorsqu’une miniature d’un fragment d’image est sélectionnée, elle s’affiche en taille réelle dans la fenêtre Preview (Aperçu) sous la bibliothèque.

Remarque :

Actuellement, l’onglet Data (Données) ne prend en charge que les données d’entraînement de la détection d’objets.

Les outils de l’onglet Data (Données) sont décrits dans le tableau suivant :

OutilDescription

Charger les données d’entraînement

Charger les données d’entraînement

Charger les données d’entraînement depuis un dossier.

Classe

Liste déroulante Class (Classe)

Sélectionner la classe pour filtrer les données d’entraînement.

Contrôles de lecture

Contrôles de lecture

Les contrôles de navigation et de lecture permettent de se déplacer parmi les fragments d’image exportés et leurs étiquettes correspondantes. Seuls 20 fragments d’image à la fois s’affichent dans la bibliothèque, mais les outils de navigation déterminent ceux à afficher.

  • Le bouton Play (Lecture) Play (Lecture) affiche tous les fragments d’image de la séquence.
  • Le bouton Pause Pause suspend la lecture.
  • La liste déroulante Speed (Vitesse) Liste Speed control (Contrôle de vitesse) contrôle la vitesse de lecture. Les options de vitesse disponibles sont 0.5x, 1x, 2x et 3x.
  • Pour les révisions manuelles, utilisez les boutons First (Premier) First (Premier), Previous (Précédent) Previous (Précédent), Next (Suivant) Next (Suivant) ou Last (Dernier) Last (Dernier) pour naviguer dans l’ensemble d’images de la liste.

Jump to (Accéder à)

Jump to (Accéder à)

Accéder à une image particulière. Indiquez le numéro d’image dans la zone de texte, puis cliquez sur le bouton Jump to (Accéder à).

Onglet Auto Review (Examen automatique)

Pour les jeux de données volumineux, la vérification manuelle peut s’avérer fastidieuse et inefficace. Les outils de l’onglet Auto Review (Examen automatique) permettent d’évaluer rapidement la qualité des étiquettes en les comparant à une petite quantité de données de réalité de terrain.

Étiquettes de détection d’objets

L’onglet Auto Review (Examen automatique) évalue automatiquement les étiquettes de la détection d’objets à l’aide des données de réalité de terrain. L’outil génère un ensemble de métriques de précision et notamment les objets communs en contexte (COCO), la précision moyenne de la moyenne (mAP) et une courbe de rappel-précision, pour évaluer la qualité des données. À l’aide du ratio d’intersection sur union (IoU), il identifie les vrais et faux positifs et négatifs et en détermine le nombre, puis génère un rapport détaillé avec toutes les métriques principales requises pour évaluer le jeu de données.

Le tableau ci-après dresse la liste des paramètres associés à l’onglet Auto Review (Examen automatique) pour la détection d’objets :

ParamètreDescription

Étiquettes

Classe d’entités surfaciques contenant les objets détectés par l’outil Détecter des objets à l’aide d’algorithmes de Deep Learning.

Entités de réalité de terrain

Classe d’entités surfaciques contenant des données de réalité de terrain.

Table de précision en sortie

Table de précision en sortie.

Rapport de précision en sortie

Nom du rapport de précision en sortie. Le rapport est un document PDF contenant des mesures et diagrammes de précision.

Champ de valeur de classe détecté

Champ dans la classe d’entités des objets détectés qui contient les valeurs de classe ou noms de classe.

Si aucun nom de champ n’est fourni, un champ Classvalue ou Value est utilisé. Si ces champs n’existent pas, tous les enregistrements sont identifiés comme appartenant à une classe.

Les valeurs ou noms de classe doivent correspondre exactement à ceux de la classe d’entités de référence de terrain.

Champ de valeur de classe de réalité de terrain

Champ dans la classe d’entités de réalité de terrain qui contient les valeurs de classe.

Si aucun nom de champ n’est fourni, un champ Classvalue ou Value est utilisé. Si ces champs n’existent pas, tous les enregistrements sont identifiés comme appartenant à une classe.

Les valeurs ou noms de classe doivent correspondre exactement à ceux de la classe d’entités des objets détectés.

Intersection sur union (IoU) minimale

Ratio IoU à utiliser comme seuil pour évaluer la précision du modèle de détection des objets. Le numérateur est la zone de superposition entre la zone de délimitation prédite et la zone de délimitation de référence de terrain. Le dénominateur est la zone d’union ou la zone englobée par les deux zones de délimitation. Les plages IoU sont comprises entre 0 et 1.

Entités de masque

Classe d’entités surfaciques qui délimite la ou les zones de calcul de la précision. La précision sera évaluée uniquement pour les entités qui intersectent le masque.

Étiquettes de classification des pixels

L’onglet Auto Review (Examen automatique) évalue automatiquement les étiquettes de la classification des pixels à l’aide des données de réalité de terrain. L’outil calcule une matrice de confusion, en fonction des erreurs d’omission et de commission, et le score IoU. La précision est calculée entre les étiquettes et les données de réalité de terrain ; les étiquettes peuvent correspondre à une classe d’entités ou une couche raster.

Le tableau ci-après dresse la liste des paramètres associés à l’onglet Auto Review (Examen automatique) pour la classification de pixels :

ParamètreDescription

Étiquettes

Raster classé en entrée.

Ground Truth Data (Données de réalité de terrain)

Image de classification en entrée ou autres données de référence de données SIG thématiques. L’entrée peut être un raster ou une classe d’entités.

Les données standard sont une image de classification (monocanal, type de données numériques entières).

Si vous utilisez des polygones en entrée, recourez uniquement à ceux qui ne sont pas utilisés comme échantillons d’apprentissage. Il peut également s’agir de données d’occupation du sol SIG au format de fichier de formes ou de classe d’entités.

Matrice de confusion en sortie

Le nom du fichier en sortie de la matrice de confusion au format tabulaire.

Le format de la table est déterminé par l’emplacement et le chemin d’accès en sortie. Par défaut, la sortie sera une table de géodatabase. Si le chemin ne se trouve pas dans une géodatabase, spécifiez l’extension .dbf pour l’enregistrer au format dBASE.

Nombre de points aléatoires

Le nombre total de points aléatoires qui vont être générés.

Le nombre réel peut être supérieur, mais ne doit jamais être inférieur à ce nombre, selon la stratégie d’échantillonnage et le nombre de classes. Le nombre pas défaut de points générés de façon aléatoire est de 500.

Stratégie d'échantillonnage

Spécifie la structure d’échantillonnage qui sera utilisée.

  • Stratified random (Aléatoire stratifié) : des points répartis de manière aléatoire sont créés dans chaque classe, chacune disposant d’un nombre de points proportionnel à sa surface relative.

  • Equalized stratified random (Aléatoire stratifié égalisé) : des points répartis de manière aléatoire sont créés dans chaque classe, chacune disposant du même nombre de points.
  • Random (Aléatoire) : des points répartis de manière aléatoire sont créés dans toute l’image.

Minimum Point Distance (Distance minimale entre les points)

Distance minimale entre les points de référence.

Rubriques connexes