ディープ ラーニング トレーニング データのコンテンツ

Image Analyst ライセンスで利用できます。

[トレーニング データのエクスポート] ツールを使用して、ArcGIS Pro で作成されたディープ ラーニング トレーニング データには、通常、次のフォルダーとファイルが含まれています。

  • images フォルダー - ソース画像から抽出された画像チップと [トレーニング データのエクスポート] ツールによってエクスポートされた画像チップを含みます。
  • labels フォルダー - 各画像チップの対応するラベルを含みます。 ラベルは、ビル、道路、樹木など、画像チップ内に存在する特定のフィーチャまたはオブジェクトを示します。
  • esri_accumulated_stats.json ファイル - トレーニング データに関する統計情報を含みます。
  • esri_model_definition.emd ファイル - Esri モデル定義 (.emd) ファイルは、エクスポートされたトレーニング データに関する情報を含みます。
  • map.txt ファイル - トレーニング中にディープ ラーニング モデルが各画像を正しいラベルに関連付けられるようにするために、画像チップと各ラベルを一覧表示します。
  • stats.txt ファイル - トレーニング データに関する統計情報を含みます。 通常、画像、フィーチャ、画像ごとのフィーチャ数、クラス、クラス固有の統計情報などの詳細が含まれます。

トレーニング データのフォルダー構造

Esri の累積された統計情報ファイル

esri_accumulated_stats.json ファイルには、エクスポートされたトレーニング データに関する統計情報が含まれます。 この情報には、以下の主要なパラメーターがあります。

  • Version - ファイルのバージョン番号。
  • NumBands - 入力画像のスペクトル バンドの総数。
  • TileSizeX - 画像チップの X ディメンション。
  • TileSizeY - 画像チップの Y ディメンション。
  • NumClasses - オブジェクト カテゴリまたはクラスの総数。
  • NumTiles - 画像チップの総数。
  • OutputFeatures - フィーチャまたはピクセルを出力するようにモデルを構成するかどうかを指定します。 パラメーターが true に設定されている場合、フィーチャを出力します。 パラメーターが false に設定されている場合、ピクセルを出力します。
  • MetaDataMode - ラベルに使用されるメタデータ形式。 たとえば、オブジェクトの検出では、タイプは PASCAL_VOC_rectangles または KITTI_rectangles のいずれかです。 利用可能な形式のリストについては、[ディープ ラーニング用のトレーニング データをエクスポート (Export Training Data For Deep Learning)] ツール内の [メタデータ形式] パラメーターをご参照ください。
  • MinCellSize - 入力ラスターおよび空間参照情報の最小ピクセル サイズ。
  • MaxCellSize - 入力ラスターおよび空間参照情報の最大ピクセル サイズ。
  • Classes - クラスの値、名前、色を含むクラスのリスト。
  • FeatureStats - フィーチャに関する統計情報。
    • NumImagesTotal - 画像チップの総数。
    • NumFeaturesTotal - フィーチャの総数。
    • NumImagesPerClass - クラスあたりの画像数。
    • NumFeaturesPerClass - クラスあたりのフィーチャ数。
    • NumFeaturesPerImage - 最小、最大、平均、合計、個数など、画像あたりのフィーチャ—の分布に関する統計情報。
    • FeatureAreaPerClass - 最小、最大、平均、合計、個数など、クラスあたりのフィーチャ—のサイズに関する統計情報。
  • InputRastersProps - ラスター数、センサー名、バンド名など、入力ラスターに関する情報。
    • RasterCount - 入力ラスターのバンド数。
    • SensorName - 入力ラスターのセンサー名。
    • BandNames - 入力ラスターのバンド名。
  • BandStatsState - 最小、最大、平均、標準偏差など、入力ラスター内の各バンドに関する統計情報。

このファイルは主に内部での使用を目的としています。 このファイルを手動で変更することはおすすめしません。予期しない結果になることがあります。

Esri モデル定義ファイル

Esri モデル定義 (.emd) ファイルは、エクスポートされたトレーニング データに関する情報を含みます。 この情報には、以下の主要なパラメーターがあります。

  • ImageHeight - 画像チップの高さディメンション。
  • ImageWidth - 画像チップの幅ディメンション。
  • MetaDataMode - ラベルに使用されるメタデータ形式。 たとえば、オブジェクトの検出では、タイプは PASCAL_VOC_rectangles または KITTI_rectangles のいずれかです。 利用可能な形式のリストについては、[ディープ ラーニング用のトレーニング データをエクスポート (Export Training Data For Deep Learning)] ツール内の [メタデータ形式] パラメーターをご参照ください。
  • BlackenAroundFeature - それぞれの画像チップ内で各オブジェクトまたはフィーチャの周囲のピクセルをマスクするかどうかを指定します。 指定可能な値は、true または false のいずれかです。
  • IsMultidimensional - 入力データが多次元か時間対応かを指定します。 指定可能な値は、true または false のいずれかです。
  • CropTileMode - エクスポートされたタイルがすべて同じサイズになるようにトリミングするかどうかを指定します。
    • Fixed size - エクスポートされたタイルが同じサイズになり、フィーチャが中央に配置されます。 これがデフォルトです。
    • Bounding box - タイル内のフィーチャだけが境界ジオメトリで囲まれるように、エクスポートされたタイルがトリミングされます。
  • MinCellSize - 入力ラスターおよび空間参照情報の最小ピクセル サイズ。
  • MaxCellSize - 入力ラスターおよび空間参照情報の最大ピクセル サイズ。
  • ImageSpaceUsed - トレーニング データの作成に使用される参照システムのタイプ。 オプションは、MAP_SPACE または PIXEL_SPACE です。
  • Classes - 異なるオブジェクト カテゴリまたはクラスの総数。 各クラスには以下の情報があります。
    • Value - クラスの一意な数値 ID。
    • Name - クラスの名前。
    • Color - 出力でのクラスの視覚化に使用されるカラー コード。
  • InputRastersProps - ラスター数、センサー名、バンド名など、入力ラスターに関する情報。
    • RasterCount - 入力ラスターのバンド数。
    • SensorName - 入力ラスターのセンサー名。
    • BandNames - 入力ラスターのバンド名。
  • AllTilesStats - 最小、最大、平均、標準偏差など、各画像チップに関する統計情報。

古い esri_model_definition.emd ファイルには、FrameworkModelConfigurationModelTypeModelFileDescriptionExtractBandsDataRangeModelPaddingBatchSizePerProcessGPUMemoryFractionWellKnownBandNames などの追加のオプション パラメーターが含まれる場合があります。

マップ テキスト ファイル

map.txt ファイルは、トレーニング中にディープ ラーニング モデルが各画像を正しいラベルに関連付けられるようにするために、画像チップと各ラベルを一覧表示します。

サンプル map.txt ファイル

統計情報ファイル

stats.txt ファイルには、トレーニング データに関する統計情報が含まれます。 通常、画像、フィーチャ、画像ごとのフィーチャ数、クラス、クラス固有の統計情報などの詳細が含まれます。

  • images - 画像チップの総数、ラスター数、バンド名、ディメンション情報など、画像チップに関する情報。
  • features - 画像内のフィーチャの総数。
  • features per image - 画像あたりのフィーチャ—の分布、最小値、平均値、最大値に関する統計情報。
  • classes - 異なるオブジェクト カテゴリまたはクラスの総数。
  • クラス固有の統計情報 - クラス名、クラス値、画像数、フィーチャ数、そのクラスに属するオブジェクトの最小サイズ、平均サイズ、最大サイズなど、各クラスの情報。

サンプル stats.txt ファイル

関連トピック