深度学习训练数据内容

获得 Image Analyst 许可后可用。

使用导出训练数据工具在 ArcGIS Pro 中创建的深度学习训练数据通常包含以下文件夹和文件。

  • 图像文件夹 - 包含从源影像中提取并由导出训练数据工具导出的影像片。
  • 标注文件夹 - 包含每个影像片对应的标注。 标注指示影像片中存在的特定要素或对象,例如建筑物、道路或树木。
  • esri_accumulated_stats.json 文件 - 包含有关训练数据的统计信息。
  • esri_model_definition.emd 文件 - Esri 模型定义 (.emd) 文件包含有关导出的训练数据的信息。
  • map.txt 文件 - 列出相应的影像片及其各自的标注,以确保深度学习模型在训练期间能够准确地将每幅影像与其正确的标注相关联。
  • stats.txt 文件 - 包含有关训练数据的统计信息。 它通常包括图像、要素、每个图像的要素、类和特定类的统计数据等详细信息。

训练数据的文件夹结构

Esri 累积的统计数据文件

esri_accumulated_stats.json 文件包含有关已导出的训练数据的统计信息。 该信息有以下关键参数:

  • Version - 文件的版本号。
  • NumBands - 输入影像中的光谱波段总数。
  • TileSizeX - 影像片的 X 尺寸。
  • TileSizeY - 影像片的 Y 尺寸。
  • NumClasses - 对象类别或类的总数。
  • NumTiles - 影像片总数。
  • OutputFeatures - 指定模型是否配置为输出要素或像素。 如果将参数设置为 true,则将输出要素。 如果将参数设置为 false,则将输出像素。
  • MetaDataMode - 用于标注的元数据格式。 例如,对于目标检测任务,类型可能是 PASCAL_VOC_rectanglesKITTI_rectangles。 对于可用格式的列表,请参阅导出训练数据进行深度学习工具中的元数据格式参数。
  • MinCellSize - 输入栅格和空间参考信息的最小像素大小。
  • MaxCellSize - 输入栅格和空间参考信息的最大像素大小。
  • Classes - 类列表,包括其值、名称和颜色。
  • FeatureStats - 有关要素的统计数据。
    • NumImagesTotal - 影像片总数。
    • NumFeaturesTotal - 要素总数。
    • NumImagesPerClass - 每个类的图像数。
    • NumFeaturesPerClass - 每个类的要素数。
    • NumFeaturesPerImage - 关于每个图像的要素分布的统计信息,例如最小值、最大值、平均值、总和和计数。
    • FeatureAreaPerClass - 有关每个类的要素大小的统计信息,例如最小值、最大值、平均值、总和和计数。
  • InputRastersProps - 有关输入栅格的信息,例如栅格计数、传感器名称和波段名称。
    • RasterCount - 输入栅格中的波段数。
    • SensorName - 输入栅格的传感器名称。
    • BandNames - 输入栅格的波段名称。
  • BandStatsState - 输入栅格中每个波段的统计信息,例如最小值、最大值、平均值和标准差。

该文件主要供内部使用。 不建议手动修改此文件,可能会导致意外结果。

Esri 模型定义文件

Esri 模型定义 (.emd) 文件包含有关导出的训练数据的信息。 该信息有以下关键参数:

  • ImageHeight - 影像片的高度尺寸。
  • ImageWidth - 影像片的宽度尺寸。
  • MetaDataMode - 用于标注的元数据格式。 例如,对于目标检测任务,类型可能是 PASCAL_VOC_rectanglesKITTI_rectangles。 对于可用格式的列表,请参阅导出训练数据进行深度学习工具中的元数据格式参数。
  • BlackenAroundFeature - 指定是否对每个影像片中的每个对象或要素周围的像素进行掩膜。 可能的值为 truefalse
  • IsMultidimensional - 指定输入数据是否是多维的或者时间感知的。 可能的值为 truefalse
  • CropTileMode - 指定是否将裁剪导出的切片,从而使其大小均相同。
    • Fixed size - 导出的切片具有相同的大小,并将以要素为中心。 这是默认设置。
    • Bounding box - 将对导出的切片进行裁剪,以使边界几何仅围绕切片中的要素。
  • MinCellSize - 输入栅格和空间参考信息的最小像素大小。
  • MaxCellSize - 输入栅格和空间参考信息的最大像素大小。
  • ImageSpaceUsed - 用于创建训练数据的参考系统的类型。 选项为 MAP_SPACEPIXEL_SPACE
  • Classes - 不同对象类别或类的总数。 每个类有以下信息:
    • Value - 类的唯一数字标识符。
    • Name - 类名称。
    • Color - 用于在输出中可视化类的颜色代码。
  • InputRastersProps - 有关输入栅格的信息,例如栅格计数、传感器名称和波段名称。
    • RasterCount - 输入栅格中的波段数。
    • SensorName - 输入栅格的传感器名称。
    • BandNames - 输入栅格的波段名称。
  • AllTilesStats - 每个影像片的统计信息,例如最小值、最大值、平均值和标准差。

旧版 esri_model_definition.emd 文件可能包括附加可选参数,例如 FrameworkModelConfigurationModelTypeModelFileDescriptionExtractBandsDataRangeModelPaddingBatchSizePerProcessGPUMemoryFractionWellKnownBandNames

地图文本文件

map.txt 文件列出相应的影像片及其各自的标注,以确保深度学习模型在训练期间能够准确地将每幅影像与其正确的标注相关联。

map.txt 文件示例

统计文件

stats.txt 文件包含有关训练数据的统计信息。 它通常包括图像、要素、每个图像的要素、类和特定类的统计数据等详细信息。

  • images - 有关影像片的信息,例如影像片的总数、波段数和尺寸信息。
  • features - 影像中的要素总数。
  • features per image - 关于每个图像的要素分布的统计信息,最小值、平均值和最大值。
  • classes - 不同对象类别或类的总数。
  • 类特定统计数据 - 每个类的信息,例如类名称、类值、影像数量、要素数量、属于该类的对象的最小大小、平均大小和最大大小。

stats.txt 文件示例

相关主题