ディープラーニング用のトレーニングデータをエクスポート (Export Training Data For Deep Learning) (Image Analyst)—ArcGIS Pro

Spatial Analyst のライセンスで利用可能。

Image Analyst ライセンスで利用できます。

概要

リモートセンシング画像を使用して、ラベルが付いたベクターまたはラスターデータをディープラーニングトレーニングデータセットに変換します。出力は画像チップのフォルダー、および指定した形式のメタデータファイルのフォルダーです。

使用法

このツールは、Google TensorFlow、Keras、PyTorch、Microsoft CNTK などのサードパーティ製ディープラーニングアプリケーションをサポートするトレーニングデータセットを作成します。
ディープラーニングクラストレーニングサンプルは、画像チップと呼ばれる対象のフィーチャまたはクラスを含む小さなサブイメージに基づきます。
既存の分類トレーニングサンプルデータや、建物フットプリントレイヤーなどの GIS フィーチャクラスデータを使用して、ソース画像からのクラスサンプルを含む画像チップを生成します。多くの場合、画像チップは 256 ピクセル (行) x 256 ピクセル (列) です (トレーニングサンプルのサイズがこれより大きくない場合)。画像チップごとにオブジェクトを 1 つ以上含めることができます。[ラベル付きタイル] メタデータ形式を使用する場合は、画像チップごとに 1 つのオブジェクトしか含めることができません。
[参照系] パラメーターを指定すると、トレーニングデータをマップ空間またはピクセル空間 (未加工の画像空間) にエクスポートして、ディープラーニングモデルトレーニングに使用することができます。
このツールは、画像のコレクションからのトレーニングデータのエクスポートに対応しています。画像フォルダーを [入力ラスター] として追加できます。[入力ラスター] がモザイクデータセットまたはイメージサービスの場合は、[処理モード] パラメーターで、モザイクを 1 つの入力データとして処理するか、各ラスターアイテムとして別々に処理するかを指定することもできます。
セルのサイズおよび範囲は、ジオプロセシング環境設定を使用して調整できます。
このツールの実行要件および発生する可能性のある問題の詳細については、「ディープラーニングに関するよくある質問」をご参照ください。

構文

ExportTrainingDataForDeepLearning(in_raster, out_folder, in_class_data, image_chip_format, {tile_size_x}, {tile_size_y}, {stride_x}, {stride_y}, {output_nofeature_tiles}, {metadata_format}, {start_index}, {class_value_field}, {buffer_radius}, {in_mask_polygons}, {rotation_angle}, {reference_system}, {processing_mode}, {blacken_around_feature}, {crop_mode})

パラメーター	説明	データタイプ
in_raster	入力ソース画像。通常は、マルチスペクトル画像です。入力ソース画像のタイプの例としては、マルチスペクトル衛星、ドローン、航空、または NAIP (National Agriculture Imagery Program) などが挙げられます。入力には、画像のフォルダーを使用できます。	Raster Dataset; Raster Layer; Mosaic Layer; Image Service; MapServer; Map Server Layer; Internet Tiled Layer; Folder
out_folder	出力画像チップとメタデータを格納するフォルダーです。このフォルダーは、クラウドストレージ接続ファイル (*.acs) を使用するフォルダー URL にすることもできます。	Folder
in_class_data	ベクターまたはラスター形式のトレーニングサンプルデータ。ベクター入力は、[トレーニングサンプルマネージャー] で生成されるようなトレーニングサンプル形式に従う必要があります。ラスター入力は、[ラスターの分類 (Classify Raster)] ツールで生成された分類ラスター形式に従う必要があります。正しいトレーニングサンプル形式に従うと、統計情報を含む最適な結果が生成されますが、クラス値フィールドなしでポイントフィーチャクラスを入力するか、クラス情報なしで整数ラスターを入力することもできます。	Feature Class; Feature Layer; Raster Dataset; Raster Layer; Mosaic Layer; Image Service
image_chip_format	画像チップ出力に使用するラスター形式を指定します。 PNG および JPEG は、3 バンドまでサポートします。 TIFF —TIFF 形式を使用します。 PNG —PNG 形式を使用します。 JPEG —JPEG 形式を使用します。 MRF —メタラスター形式 (MRF) を使用します。	String
tile_size_x (オプション)	画像チップの X ディメンションのサイズ。	Long
tile_size_y (オプション)	画像チップの Y ディメンションのサイズ。	Long
stride_x (オプション)	次の画像チップを作成する際に X 方向に移動する距離。ストライドがタイルサイズと等しい場合、オーバーラップは発生しません。ストライドがタイルサイズの半分と等しい場合は、50% のオーバーラップが発生します。	Long
stride_y (オプション)	次の画像チップを作成する際に Y 方向に移動する距離。ストライドがタイルサイズと等しい場合、オーバーラップは発生しません。ストライドがタイルサイズの半分と等しい場合は、50% のオーバーラップが発生します。	Long
output_nofeature_tiles (オプション)	トレーニングサンプルをキャプチャしない画像チップをエクスポートするかどうかを指定します。 ALL_TILES —トレーニングサンプルをキャプチャしないものも含め、すべての画像チップをエクスポートします。 ONLY_TILES_WITH_FEATURES —トレーニングサンプルをキャプチャする画像チップのみをエクスポートします。これがデフォルトです。	Boolean
metadata_format (オプション)	出力メタデータラベルの形式を指定します。トレーニングデータの出力メタデータラベルのオプションは、[KITTI] の四角形、[PASCAL VOC] の四角形、[分類タイル] (クラスマップ)、[RCNN マスク]、[ラベル付きタイル]、[複数のラベル付きタイル]、[タイルのエクスポート] です。入力トレーニングサンプルデータが建物レイヤーなどのフィーチャクラスレイヤーまたは標準分類トレーニングサンプルファイルの場合、KITTI または PASCAL VOC の四角形オプションを使用します。出力メタデータは、最小境界範囲内のトレーニングサンプルデータを含む .txt ファイルまたは .xml ファイルです。メタデータファイルの名前は、入力ソース画像名と一致します。入力トレーニングサンプルデータがクラスマップの場合、出力メタデータ形式として [分類タイル] オプションを使用します。 KITTI_rectangles —メタデータは、KITTI (Karlsruhe Institute of Technology and Toyota Technological Institute) オブジェクト検出評価データセットと同じ形式に従います。KITTI データセットは、Vision Benchmark Suite です。ラベルファイルは、プレーンテキストファイルです。数値および文字列のすべての値はスペースで区切られ、各行は 1 つのオブジェクトと対応しています。この形式の使用目的はオブジェクト検出です。 PASCAL_VOC_rectangles —メタデータは、PASCAL_VOC (Pattern Analysis, Statistical Modeling and Computational Learning, Visual Object Classes) データセットと同じ形式に従います。PASCAL VOC データセットは、オブジェクトクラスの認識のために標準化された画像データセットです。ラベルファイルは XML 形式で、画像名、クラス値、境界四角形に関する情報が含まれています。この形式の使用目的はオブジェクト検出です。これがデフォルトです。 Classified_Tiles —1 つの入力画像チップにつき、分類された画像チップが 1 つ出力されます。各画像チップに対してその他のメタデータは使用されません。統計出力だけに、クラスに関する詳細情報 (クラス名、クラス値、出力統計など) が含まれます。この形式の使用目的はピクセル分類です。 RCNN_Masks —サンプルが存在する領域にマスクが含まれる画像チップが出力されます。このモデルは、画像内のオブジェクトの各インスタンスに対して、境界四角形とセグメンテーションマスクを生成します。ディープラーニングフレームワークモデルの FPN (Feature Pyramid Network) と ResNet101 バックボーンに基づいています。この形式の使用目的はオブジェクト検出です。 Labeled_Tiles —各出力タイルは、特定のクラスでラベル付けされます。この形式の使用目的はオブジェクト分類です。 MultiLabeled_Tiles —各出力タイルは、1 つ以上のクラスでラベル付けされます。たとえば、タイルに「agriculture」および「cloudy」とラベル付けすることができます。この形式の使用目的はオブジェクト分類です。 Export_Tiles —出力は、ラベルのない画像チップです。この形式は、超解像などの画像処理技術に使用されます。 KITTI メタデータ形式では 15 個の列が作成されますが、そのうちツールで使用されるのは 5 つのみです。最初の列はクラス値です。次の 3 つの列はスキップされます。5 ～ 8 番目の列は、4 つの画像座標位置 (上下左右のピクセル) で構成される最小境界範囲を定義します。最小境界範囲には、ディープラーニング分類器に使用されるトレーニングチップが含まれます。残りの列は使用されません。次に、PASCAL VOC オプションの例を示します。 `<?xml version=”1.0”?> - <layout> <image>000000000</image> <object>1</object> - <part> <class>1</class> - <bndbox> <xmin>31.85</xmin> <ymin>101.52</ymin> <xmax>256.00</xmax> <ymax>256.00</ymax> </bndbox> </part> </layout>` 詳細については、「PASCAL Visual Object Classes」をご参照ください。	String
start_index (オプション)	レガシー: このパラメーターは非推奨になりました。Python 内で値として 0 または # を使用します。	Long
class_value_field (オプション)	クラス値を含むフィールド。フィールドが指定されていない場合、value フィールドまたは classvalue フィールドを検索します。フィーチャにクラスフィールドが含まれていない場合、すべてのレコードが 1 つのクラスに属していると判断します。	Field
buffer_radius (オプション)	トレーニングサンプル領域を描画する、各トレーニングサンプルの周囲のバッファーの半径。これを使用して、ポイントから円形ポリゴンのトレーニングサンプルを作成できます。 in_class_data 空間参照の距離単位が使用されます。	Double
in_mask_polygons (オプション)	画像チップが作成される領域を描画するポリゴンフィーチャクラス。このポリゴンに完全に含まれる画像チップのみが作成されます。	Feature Layer
rotation_angle (オプション)	追加の画像チップを生成するために使用される回転角度。画像チップは、0 の回転角度 (つまり、回転しない) で生成されます。その後、画像チップは、追加の画像チップを作成するために、指定した角度で回転されます。データ拡大のために、同じトレーニングサンプルが、複数の角度の複数の画像チップでキャプチャされます。デフォルトの回転角度は 0 です。	Double
reference_system (オプション)	入力画像を解釈するために使用する参照系のタイプを指定します。指定する参照系は、ディープラーニングモデルをトレーニングするために使用する参照系と一致する必要があります。 MAP_SPACE —マップベースの座標系が使用されます。これがデフォルトです。 PIXEL_SPACE —回転と歪みのない画像空間が使用されます。	String
processing_mode (オプション)	モザイクデータセットまたはイメージサービス内のすべてのラスターアイテムを処理する方法を指定します。入力ラスターがモザイクデータセットまたはイメージサービスである場合、このパラメーターが適用されます。 PROCESS_AS_MOSAICKED_IMAGE —モザイクデータセットまたはイメージサービス内のすべてのラスターアイテムがモザイク化され、処理されます。これがデフォルトです。 PROCESS_ITEMS_SEPARATELY —モザイクデータセットまたはイメージサービス内のすべてのラスターアイテムが、個別の画像として処理されます。	String
blacken_around_feature (オプション)	それぞれの画像ファイル内で各オブジェクトまたはフィーチャの周囲のピクセルをマスクするかどうかを指定します。このパラメーターは、メタデータ形式が [Labeled_Tiles] に設定されており、入力フィーチャクラスまたは分類ラスターが指定されている場合にのみ適用されます。 NO_BLACKEN —オブジェクトまたはフィーチャの周囲のピクセルがマスクされません。これがデフォルトです。 BLACKEN_AROUND_FEATURE —オブジェクトまたはフィーチャの周囲のピクセルがマスクされます。	Boolean
crop_mode (オプション)	エクスポートされたタイルがすべて同じサイズになるようにトリミングするかどうかを指定します。このパラメーターは、メタデータ形式が [Labeled_Tiles] に設定されており、入力フィーチャクラスまたは分類ラスターが指定されている場合にのみ適用されます。 FIXED_SIZE —エクスポートされたタイルが同じサイズにトリミングされ、フィーチャが中央に配置されます。これがデフォルトです。 BOUNDING_BOX —タイル内のフィーチャだけが境界ジオメトリで囲まれるように、エクスポートされたタイルがトリミングされます。	String

コードのサンプル

ExportTrainingDataForDeepLearning (ディープラーニング用のトレーニングデータをエクスポート) の例 1 (Python ウィンドウ)

この例では、ディープラーニング用のトレーニングサンプルを作成します。

# Import system modules
import arcpy
from arcpy.ia import *

# Check out the ArcGIS Image Analyst extension license
arcpy.CheckOutExtension("ImageAnalyst")

ExportTrainingDataForDeepLearning("c:/test/image.tif", "c:/test/outfolder", 
    "c:/test/training.shp", "TIFF", "256", "256", "128", "128", 
	"ONLY_TILES_WITH_FEATURES", "Labeled_Tiles", 0, "Classvalue", 
	0, None, 0, "MAP_SPACE", "PROCESS_AS_MOSAICKED_IMAGE", "NO_BLACKEN", "FIXED_SIZE")

ExportTrainingDataForDeepLearning (ディープラーニング用のトレーニングデータをエクスポート) の例 2 (スタンドアロンスクリプト)

この例では、ディープラーニング用のトレーニングサンプルを作成します。

# Import system modules and check out ArcGIS Image Analyst extension license
import arcpy
arcpy.CheckOutExtension("ImageAnalyst")
from arcpy.ia import *

# Set local variables
inRaster = "c:/test/InputRaster.tif"
out_folder = "c:/test/OutputFolder"
in_training = "c:/test/TrainingData.shp"
image_chip_format = "TIFF"
tile_size_x = "256"
tile_size_y = "256"
stride_x= "128"
stride_y= "128"
output_nofeature_tiles= "ONLY_TILES_WITH_FEATURES"
metadata_format= "Labeled_Tiles"
start_index = 0
classvalue_field = "Classvalue"
buffer_radius = 0
in_mask_polygons = "MaskPolygon"
rotation_angle = 0
reference_system = "PIXEL_SPACE"
processing_mode = "PROCESS_AS_MOSAICKED_IMAGE"
blacken_around_feature = "NO_BLACKEN"
crop_mode = “FIXED_SIZE”

# Execute 
ExportTrainingDataForDeepLearning(inRaster, out_folder, in_training, 
    image_chip_format,tile_size_x, tile_size_y, stride_x, 
    stride_y,output_nofeature_tiles, metadata_format, start_index, 
    classvalue_field, buffer_radius, in_mask_polygons, rotation_angle, 
    reference_system, processing_mode, blacken_around_feature, crop_mode)

環境

セルサイズ, 現在のワークスペース, 範囲, テンポラリワークスペース

ライセンス情報

Basic: 次のものが必要 Image Analyst または Spatial Analyst
Standard: 次のものが必要 Image Analyst または Spatial Analyst
Advanced: 次のものが必要 Image Analyst または Spatial Analyst

概要

使用法

構文

レガシー:

コードのサンプル

環境

ライセンス情報

関連トピック

このトピックの内容