Contenu des données d’entraînement de Deep Learning

Disponible avec une licence Image Analyst.

Les données d’entraînement de Deep Learning créées dans ArcGIS Pro, à l’aide de l’outil Exporter des données d’entraînement, contiennent généralement certains dossiers et fichiers :

  • Dossier Images : contient les fragments d’image extraits à partir de l’imagerie source et exportés par l’outil Exporter des données d’entraînement.
  • Dossier Labels (Étiquettes) : contient l’étiquette correspondante pour chaque fragment d’image. Les étiquettes indiquent les entités ou les objets spécifiques présents dans le fragment d’image, comme les bâtiments, les routes ou les arbres.
  • Fichier esri_accumulated_stats.json : contient des informations statistiques sur les données d’entraînement.
  • Fichier esri_model_definition.emd : le fichier de définition de modèle Esri (.emd) contient des informations sur les données d’entraînement exportées.
  • Fichier map.txt : répertorie les fragments d’image correspondants et leurs étiquettes respectives pour s’assurer que le modèle de Deep Learning peut associer avec exactitude chaque image à son étiquette appropriée lors de l’entraînement.
  • Fichier stats.txt : contient des informations statistiques sur les données d’entraînement. Il inclut généralement des détails comme les images, les entités, les entités par image, les classes et les statistiques spécifiques des classes.

Structure de dossiers des données d’entraînement

Fichier des statistiques cumulées Esri

Le fichier esri_accumulated_stats.json contient des informations statistiques sur les données d’entraînement exportées. Ces informations incluent les principaux paramètres suivants :

  • Version : numéro de version du fichier.
  • NumBands : nombre total de bandes spectrales dans les images en entrée.
  • TileSizeX : dimension X des fragments d’image.
  • TileSizeY : dimension Y des fragments d’image.
  • NumClasses : nombre total des catégories ou classes d’objet.
  • NumTiles : nombre total de fragments d’image.
  • OutputFeatures : indique si le modèle est configuré pour générer des entités ou des pixels en sortie. Si le paramètre est défini sur true, il génère des entités en sortie. Si le paramètre est défini sur false, il génère des pixels en sortie.
  • MetaDataMode : format de métadonnées utilisé pour les étiquettes. Par exemple, dans le cas d’une tâche de détection d’objets, le type peut être PASCAL_VOC_rectangles ou KITTI_rectangles. Pour obtenir la liste des formats disponibles, reportez-vous au paramètre Metadata Format (Format des métadonnées) dans l’outil Exporter les données d’entraînement pour le Deep Learning.
  • MinCellSize : taille de pixel minimale du raster en entrée et informations de référence spatiale.
  • MaxCellSize : taille de pixel maximale du raster en entrée et informations de référence spatiale.
  • Classes : liste des classes, comprenant leur valeur, leur nom et leur couleur.
  • FeatureStats : statistiques sur les entités.
    • NumImagesTotal : nombre total de fragments d’image.
    • NumFeaturesTotal : nombre total d’entités.
    • NumImagesPerClass : nombre d’images par classe.
    • NumFeaturesPerClass : nombre d’entités par classe.
    • NumFeaturesPerImage : informations statistiques sur la distribution des entités par image, comme le minimum, le maximum, la moyenne, la somme et le nombre total.
    • FeatureAreaPerClass : informations statistiques sur la taille des entités par classe, comme le minimum, le maximum, la moyenne, la somme et le nombre total.
  • InputRastersProps : informations sur le raster en entrée, comme le nombre de rasters, le nom du capteur et les noms de bande.
    • RasterCount : nombre de bandes dans le raster en entrée.
    • SensorName : nom du capteur du raster en entrée.
    • BandNames : noms de bande du raster en entrée.
  • BandStatsState : informations statistiques sur chaque bande dans le raster en entrée, comme le minimum, le maximum, la moyenne et l’écart type.

Ce fichier est principalement destiné à l’usage interne. Il n’est pas recommandé de le modifier manuellement, ce qui pourrait générer des résultats inattendus.

Fichier de définition du modèle Esri

Le fichier de définition de modèle Esri (.emd) contient des informations sur les données d’entraînement exportées. Ces informations incluent les principaux paramètres suivants :

  • ImageHeight : dimension de hauteur des fragments d’image.
  • ImageWidth : dimension de largeur des fragments d’image.
  • MetaDataMode : format de métadonnées utilisé pour les étiquettes. Par exemple, dans le cas d’une tâche de détection d’objets, le type peut être PASCAL_VOC_rectangles ou KITTI_rectangles. Pour obtenir la liste des formats disponibles, reportez-vous au paramètre Metadata Format (Format des métadonnées) dans l’outil Exporter les données d’entraînement pour le Deep Learning.
  • BlackenAroundFeature : indique si les pixels autour de chaque objet ou entité de chaque fragment d’image sont masqués. Les valeurs possibles sont true et false.
  • IsMultidimensional : indique si les données en entrée sont multidimensionnelles ou temporelles. Les valeurs possibles sont true et false.
  • CropTileMode : indique si les tuiles exportées sont rognées pour faire toutes la même taille.
    • Fixed size : les tuiles exportées font la même taille et sont centrées sur l’entité. Il s’agit de l’option par défaut.
    • Bounding box : les tuiles exportées sont rognées de telle sorte que l’emprise géométrique entoure uniquement l’entité dans la tuile.
  • MinCellSize : taille de pixel minimale du raster en entrée et informations de référence spatiale.
  • MaxCellSize : taille de pixel maximale du raster en entrée et informations de référence spatiale.
  • ImageSpaceUsed : type du système de référence utilisé pour créer les données d’entraînement. Les options sont MAP_SPACE ou PIXEL_SPACE.
  • Classes : nombre total des différentes catégories ou classes d’objet. Chaque classe possède les informations suivantes :
    • Value : identifiant numérique unique de la classe.
    • Name : nom de la classe.
    • Color : code couleur utilisé pour visualiser la classe dans la sortie.
  • InputRastersProps : informations sur le raster en entrée, comme le nombre de rasters, le nom du capteur et les noms de bande.
    • RasterCount : nombre de bandes dans le raster en entrée.
    • SensorName : nom du capteur du raster en entrée.
    • BandNames : noms de bande du raster en entrée.
  • AllTilesStats : informations statistiques sur chaque fragment d’image, comme le minimum, le maximum, la moyenne et l’écart type.

Les fichiers esri_model_definition.emd antérieurs peuvent inclure des paramètres facultatifs supplémentaires comme Framework, ModelConfiguration, ModelType, ModelFile, Description, ExtractBands, DataRange, ModelPadding, BatchSize, PerProcessGPUMemoryFraction ou WellKnownBandNames.

Fichier texte d’appariement

Le fichier map.txt répertorie les fragments d’image correspondants et leurs étiquettes respectives pour s’assurer que le modèle de Deep Learning peut associer avec exactitude chaque image à son étiquette appropriée lors de l’entraînement.

Exemple de fichier map.txt

Le fichier de statistiques

Le fichier stats.txt contient des informations statistiques sur les données d’entraînement. Il inclut généralement des détails comme les images, les entités, les entités par image, les classes et les statistiques spécifiques des classes :

  • images : informations sur les fragments d’image, comme le nombre total de fragments d’image, le nombre de bandes et les dimensions.
  • features : nombre total d’entités dans les images.
  • features per image : informations statistiques sur la distribution des entités par image, comme le minimum, la moyenne et le maximum.
  • classes : nombre total des différentes catégories ou classes d’objet.
  • Statistiques spécifiques de la classe : informations propres à chaque classe, comme le nom de la classe, la valeur de la classe, le nombre d’images, le nombre d’entités, la taille minimale, la taille moyenne et la taille maximale des objets appartenant à cette classe.

Exemple de fichier stats.txt

Rubriques connexes