ディープラーニングに使用するラベルオブジェクト—ArcGIS Pro

Image Analyst ライセンスで利用できます。

Spatial Analyst のライセンスで利用可能。

すべての教師付きディープラーニングタスクはラベル付きのデータセットに依存しているため、人間がその知識を活用して、識別させる内容に対してニューラルネットワークをトレーニングする必要があります。ラベル付きのオブジェクトは、ニューラルネットワークがデータの推論の実行に使用できるモデルをトレーニングするために使用します。

画像のアノテーションまたはラベリングは、コンピュータービジョンや学習などのディープラーイングタスクに欠かすことができません。優れたディープラーニングモデルをトレーニングするには、大量のラベル付きデータが必要です。適切なトレーニングデータを利用できる場合、ディープラーニングシステムは、フィーチャ抽出、パターン認識、および複雑な問題の解決を非常に正確に実行できます。[ ディープラーニングのオブジェクトのラベル付け] ウィンドウを使用して、データに迅速かつ正確にラベルを付けることができます。

[ディープラーニングのオブジェクトのラベル付け] ボタンは、[画像] タブの [画像分類] グループの [分類ツール] ドロップダウンメニューにあります。このウィンドウは、2 つのパートに分かれています。ウィンドウの上部はクラスの管理に使用され、ウィンドウの下部はサンプルのコレクションの管理とディープラーニングフレームワークのトレーニングデータのエクスポートに使用されます。

クラスの作成とオブジェクトのラベル付け

ウィンドウの上部では、オブジェクトクラスを管理し、ディープラーニングモデルのトレーニングに使用するオブジェクトを手動で作成できます。ラベル付きオブジェクトの作成に役立つさまざまなツールがあります。


ツール	機能
	ラスター内のフィーチャまたはオブジェクトの周囲に四角形を描画して、ラベル付きオブジェクトを作成します。
	ラスター内のフィーチャまたはオブジェクトの周囲にポリゴンを描画して、ラベル付きオブジェクトを作成します。
	ラスター内のフィーチャまたはオブジェクトの周囲に円を描画して、ラベル付きオブジェクトを作成します。
	ラスター内のフィーチャまたはオブジェクトの周囲にフリーハンドの図形を描画して、ラベル付きオブジェクトを作成します。
	セグメントレイヤーからセグメントを選択して、フィーチャを作成します。このオプションは、[コンテンツ] ウィンドウ内にセグメントレイヤーが存在する場合にのみ使用できます。[コンテンツ] ウィンドウ内のセグメントレイヤーをハイライト表示させることによって、[セグメントピッカー] をアクティブにし、[セグメントピッカー] ドロップダウンリストからレイヤーを選択します。
	ラベル付きオブジェクトを選択および編集します。
	分類スキーマを作成します。
	分類スキーマのオプションを選択します。既存のスキーマを参照します。新しいスキーマを既存のトレーニングサンプルフィーチャクラスから生成します。新しいスキーマを既存の分類ラスターから生成します。デフォルトの 2011 年の National Land Cover Database スキーマを使用します。
	変更をスキーマに保存します。
	スキーマの新しいコピーを保存します。
	クラスカテゴリをスキーマに追加します。まず、スキーマの名前を選択して、最高レベルの親クラスを作成します。既存のクラスの名前を選択して、サブクラスを作成します。
	選択したクラスカテゴリまたはサブクラスカテゴリをスキーマから削除します。

オブジェクトサンプルの収集を開始するには、[四角形]、[ポリゴン]、[円]、[フリーハンド] などのスケッチツールのいずれかをクリックします。
スケッチツールを使用して、オブジェクトを表す画像フィーチャをマップに描画します。
1. クラスを指定せずにフィーチャを作成している場合、[クラスの定義] ダイアログボックスが表示されます。このダイアログボックスの詳細については、「クラスの定義」をご参照ください。
上記の手順で、引き続きオブジェクトの作成とラベル付けを行います。
[ラベル付きオブジェクト] タブ (ウィンドウの下部) を使用して、ラベル付きオブジェクトのサンプルを削除および整理できます。
すべてのラベル付きオブジェクトに問題がなければ、[ラベル付きオブジェクト] タブの [保存] ボタンをクリックしてサンプルを保存します。

これでオブジェクトの代表的なサンプルに手動でラベルを付けたので、これらを使用してトレーニングデータをエクスポートできます。

クラスの定義

[クラスの定義] ダイアログボックスを使用して、新しいクラスを作成したり、既存のクラスを定義したりできます。[既存のクラスを使用] を選択した場合は、そのオブジェクトに適切な [クラス名] オプションを選択します。[新しいクラスの追加] を選択した場合、必要に応じて情報を編集し、[OK] をクリックして新しいクラスを作成できます。

ラベル付きオブジェクト

ウィンドウの下部のセクションにある [ラベル付きオブジェクト] タブでは、クラスごとに収集したトレーニングサンプルが表示され、管理されます。画像内のクラスごとに、代表的な領域 (つまり、トレーニングサンプル) を収集します。トレーニングサンプルは、位置情報 (ポリゴン) および関連するクラスを含んでいます。画像分類アルゴリズムは、フィーチャクラスとして保存されたトレーニングサンプルを使用して、画像全体の土地被覆クラスを識別します。

トレーニングサンプルを表示し、それらを追加したり、グループ化したり、削除することによって、管理できます。トレーニングサンプルを選択すると、マップ上でそのサンプルが選択されます。テーブル内のトレーニングサンプルをダブルクリックすると、マップ内のそのサンプルにズームします。


ツール	機能
	既存のトレーニングサンプルフィーチャクラスを開きます。
	現在のラベル付きオブジェクトフィーチャクラスに対して行った編集内容を保存します。
	現在のラベル付きオブジェクトを新しいフィーチャクラスとして保存します。
	選択したラベル付きオブジェクトを削除します。

トレーニングデータのエクスポート

サンプルを収集したら、[トレーニングデータのエクスポート] タブをクリックして、サンプルをトレーニングデータにエクスポートできます。その後、トレーニングデータをディープラーニングモデルで使用できます。パラメーターを入力したら、[実行] をクリックしてトレーニングデータを作成します。


パラメーター	説明
出力フォルダー	トレーニングデータを保存する出力フォルダーを選択します。
マスクポリゴンフィーチャ	画像チップが作成される領域を描画するポリゴンフィーチャクラス。このポリゴンに完全に含まれる画像チップのみが作成されます。
イメージ形式	画像チップ出力のラスター形式を指定します。 TIFF。これがデフォルトです。 MRF (Meta Raster Format)。 PNG。 JPEG。 PNG および JPEG は、3 バンドまでサポートします。
タイルサイズ X	画像チップのサイズ (X ディメンション)。
タイルサイズ Y	画像チップのサイズ (Y ディメンション)。
ストライド X	次の画像チップを作成する際に X 方向に移動する距離。ストライドがタイルサイズと等しい場合、オーバーラップは発生しません。ストライドがタイルサイズの半分と等しい場合は、50% のオーバーラップが発生します。
ストライド Y	次の画像チップを作成する際に Y 方向に移動する距離。ストライドがタイルサイズと等しい場合、オーバーラップは発生しません。ストライドがタイルサイズの半分と等しい場合は、50% のオーバーラップが発生します。
回転角度	追加の画像チップを生成するために使用する回転角度。画像チップは、0 の回転角度 (つまり、回転しない) で生成されます。その後、画像チップは、追加の画像チップを作成するために、指定した角度で回転されます。データ拡大のために、同じトレーニングサンプルが、複数の角度の複数の画像チップで取得されます。デフォルトの回転角度は 0 です。
フィーチャなしのタイルを出力	トレーニングサンプルをキャプチャしない画像チップをエクスポートするかどうかを指定します。オフ - トレーニングサンプルを取得する画像チップのみをエクスポートします。これがデフォルトです。オン - トレーニングサンプルを取得しないものも含め、すべての画像チップをエクスポートします。
メタデータ形式	出力メタデータラベルの形式を指定します。トレーニングデータの出力メタデータラベルには、[KITTI] の四角形、[PASCAL VOC] の四角形、[分類タイル] (クラスマップ)、[RCNN マスク]、および [ラベル付きタイル] の 5 つのオプションがあります。入力トレーニングサンプルデータがビルディングレイヤーなどのフィーチャクラスレイヤーまたは標準分類トレーニングサンプルファイルの場合、KITTI または PASCAL VOC の四角形オプションを使用します。出力メタデータは、最小境界範囲内のトレーニングサンプルデータを含む .txt ファイルまたは .xml ファイルです。メタデータファイルの名前は、入力ソース画像名と一致します。入力トレーニングサンプルデータがクラスマップの場合、出力メタデータ形式として [分類タイル] オプションを使用します。 KITTI ラベル - メタデータは、KITTI (Karlsruhe Institute of Technology and Toyota Technological Institute) オブジェクト検出評価データセットと同じ形式に従います。KITTI データセットは、Vision Benchmark Suite です。ラベルファイルは、プレーンテキストファイルです。数値および文字列のすべての値はスペースで区切られ、各行は 1 つのオブジェクトと対応しています。 PASCAL Visual Object Classes - メタデータは、PASCAL VOC (Pattern Analysis, Statistical Modeling and Computational Learning, Visual Object Classes) データセットと同じ形式に従います。PASCAL VOC データセットは、オブジェクトクラスの認識のために標準化された画像データセットです。ラベルファイルは XML ファイルで、画像名、クラス値、境界四角形に関する情報が含まれています。これがデフォルトです。分類済みタイル - 1 つの入力画像チップにつき、分類された画像チップが 1 つ出力されます。各画像チップに対してその他のメタデータは使用されません。統計出力だけに、クラスに関する詳細情報 (クラス名、クラス値、出力統計など) が含まれます。 RCNN マスク - サンプルが存在する領域にマスクが含まれる画像チップが出力されます。このモデルは、画像内のオブジェクトの各インスタンスに対して、境界四角形とセグメンテーションマスクを生成します。ディープラーニングフレームワークモデルの FPN (Feature Pyramid Network) と ResNet101 バックボーンに基づいています。ラベル付きタイル - 各出力タイルは、特定のクラスでラベル付けされます。このメタデータ形式を選択した場合、[フィーチャの周囲を黒く表示] パラメーターおよび [トリミングモード] パラメーターを詳細に調整できます。 KITTI メタデータ形式では 15 個の列が作成されますが、そのうちツールで使用されるのは 5 つのみです。最初の列はクラス値です。次の 3 つの列はスキップされます。5 ～ 8 番目の列は、4 つの画像座標位置 (それぞれ、上下左右のピクセル) で構成される最小境界範囲を定義します。最小境界範囲には、ディープラーニング分類器に使用されるトレーニングチップが含まれます。残りの列は使用されません。
フィーチャの周囲を黒く表示	それぞれの画像ファイル内で各オブジェクトまたはフィーチャの周囲のピクセルを黒く表示するかどうかを指定します。オフ - オブジェクトまたはフィーチャの周囲のピクセルが黒く表示されません。これがデフォルトです。オン - オブジェクトまたはフィーチャの周囲のピクセルが黒く表示されます。このパラメーターは、メタデータ形式が [ラベル付きタイル] に設定されており、入力フィーチャクラスまたは分類ラスターが指定されている場合にのみ適用されます。
トリミングモード	エクスポートされたタイルがすべて同じサイズになるようにトリミングするかどうかを指定します。固定サイズ - エクスポートされたタイルが同じサイズになり、フィーチャが中央に配置されます。これがデフォルトです。境界四角形 - タイル内のフィーチャだけが境界ジオメトリで囲まれるように、エクスポートされたタイルがトリミングされます。このパラメーターは、メタデータ形式が [ラベル付きタイル] に設定されており、入力フィーチャクラスまたは分類ラスターが指定されている場合にのみ適用されます。
参照系	入力画像を解釈するために使用する参照系のタイプを指定します。指定する参照系は、ディープラーニングモデルをトレーニングするために使用する参照系と一致する必要があります。マップ空間 - 入力画像はマップベースの座標系です。これがデフォルトです。ピクセル空間 - 入力画像は画像空間内で回転も変形もされません。

これで、エクスポートされたトレーニングデータが、ディープラーニングモデル内で使用できるようになりました。

クラスの作成とオブジェクトのラベル付け

クラスの定義

ラベル付きオブジェクト

トレーニング データのエクスポート

関連トピック

このトピックの内容

トレーニングデータのエクスポート