ディープ ラーニングに使用するラベル オブジェクト

Image Analyst ライセンスで利用できます。

Spatial Analyst のライセンスで利用可能。

すべての教師付きディープ ラーニング タスクはラベル付きのデータセットに依存しているため、人間がその知識を活用して、識別させる内容に対してニューラル ネットワークをトレーニングする必要があります。ラベル付きのオブジェクトは、ニューラル ネットワークがデータの推論の実行に使用できるモデルをトレーニングするために使用します。

画像のアノテーションまたはラベリングは、コンピューター ビジョンや学習などのディープ ラーイング タスクに欠かすことができません。優れたディープ ラーニング モデルをトレーニングするには、大量のラベル付きデータが必要です。適切なトレーニング データを利用できる場合、ディープ ラーニング システムは、フィーチャ抽出、パターン認識、および複雑な問題の解決を非常に正確に実行できます。[ ディープ ラーニングのオブジェクトのラベル付け] ウィンドウを使用して、データに迅速かつ正確にラベルを付けることができます。

[ディープ ラーニングのオブジェクトのラベル付け] ボタンは、[画像] タブの [画像分類] グループの [分類ツール] ドロップダウン メニューにあります。このウィンドウは、2 つのパートに分かれています。ウィンドウの上部はクラスの管理に使用され、ウィンドウの下部はサンプルのコレクションの管理とディープ ラーニング フレームワークのトレーニング データのエクスポートに使用されます。

クラスの作成とオブジェクトのラベル付け

ウィンドウの上部では、オブジェクト クラスを管理し、ディープ ラーニング モデルのトレーニングに使用するオブジェクトを手動で作成できます。ラベル付きオブジェクトの作成に役立つさまざまなツールがあります。

ツール機能
New Rectangle

ラスター内のフィーチャまたはオブジェクトの周囲に四角形を描画して、ラベル付きオブジェクトを作成します。

New Polygon

ラスター内のフィーチャまたはオブジェクトの周囲にポリゴンを描画して、ラベル付きオブジェクトを作成します。

New Circle

ラスター内のフィーチャまたはオブジェクトの周囲に円を描画して、ラベル付きオブジェクトを作成します。

New Lasso Area

ラスター内のフィーチャまたはオブジェクトの周囲にフリーハンドの図形を描画して、ラベル付きオブジェクトを作成します。

ポリゴンによる選択

セグメント レイヤーからセグメントを選択して、フィーチャを作成します。このオプションは、[コンテンツ] ウィンドウ内にセグメント レイヤーが存在する場合にのみ使用できます。[コンテンツ] ウィンドウ内のセグメント レイヤーをハイライト表示させることによって、[セグメント ピッカー] をアクティブにし、[セグメント ピッカー] ドロップダウン リストからレイヤーを選択します。

編集

ラベル付きオブジェクトを選択および編集します。

新しいテンプレート

分類スキーマを作成します。

参照

分類スキーマのオプションを選択します。

  • 既存のスキーマを参照します。
  • 新しいスキーマを既存のトレーニング サンプル フィーチャクラスから生成します。
  • 新しいスキーマを既存の分類ラスターから生成します。
  • デフォルトの 2011 年の National Land Cover Database スキーマを使用します。

保存

変更をスキーマに保存します。

編集の保存

スキーマの新しいコピーを保存します。

追加

クラス カテゴリをスキーマに追加します。まず、スキーマの名前を選択して、最高レベルの親クラスを作成します。既存のクラスの名前を選択して、サブクラスを作成します。

選択アイテムの削除

選択したクラス カテゴリまたはサブクラス カテゴリをスキーマから削除します。

  1. オブジェクト サンプルの収集を開始するには、[四角形][ポリゴン][円][フリーハンド] などのスケッチ ツールのいずれかをクリックします。
  2. スケッチ ツールを使用して、オブジェクトを表す画像フィーチャをマップに描画します。
    1. クラスを指定せずにフィーチャを作成している場合、[クラスの定義] ダイアログ ボックスが表示されます。このダイアログ ボックスの詳細については、「クラスの定義」をご参照ください。
  3. 上記の手順で、引き続きオブジェクトの作成とラベル付けを行います。
  4. [ラベル付きオブジェクト] タブ (ウィンドウの下部) を使用して、ラベル付きオブジェクトのサンプルを削除および整理できます。
  5. すべてのラベル付きオブジェクトに問題がなければ、[ラベル付きオブジェクト] タブの [保存] ボタン 保存 をクリックしてサンプルを保存します。

これでオブジェクトの代表的なサンプルに手動でラベルを付けたので、これらを使用してトレーニング データをエクスポートできます。

クラスの定義

[クラスの定義] ダイアログ ボックスを使用して、新しいクラスを作成したり、既存のクラスを定義したりできます。[既存のクラスを使用] を選択した場合は、そのオブジェクトに適切な [クラス名] オプションを選択します。[新しいクラスの追加] を選択した場合、必要に応じて情報を編集し、[OK] をクリックして新しいクラスを作成できます。

ラベル付きオブジェクト

ウィンドウの下部のセクションにある [ラベル付きオブジェクト] タブでは、クラスごとに収集したトレーニング サンプルが表示され、管理されます。画像内のクラスごとに、代表的な領域 (つまり、トレーニング サンプル) を収集します。トレーニング サンプルは、位置情報 (ポリゴン) および関連するクラスを含んでいます。画像分類アルゴリズムは、フィーチャクラスとして保存されたトレーニング サンプルを使用して、画像全体の土地被覆クラスを識別します。

トレーニング サンプルを表示し、それらを追加したり、グループ化したり、削除することによって、管理できます。トレーニング サンプルを選択すると、マップ上でそのサンプルが選択されます。テーブル内のトレーニング サンプルをダブルクリックすると、マップ内のそのサンプルにズームします。

ツール機能
参照

既存のトレーニング サンプル フィーチャクラスを開きます。

保存

現在のラベル付きオブジェクト フィーチャクラスに対して行った編集内容を保存します。

編集の保存

現在のラベル付きオブジェクトを新しいフィーチャクラスとして保存します。

選択アイテムの削除

選択したラベル付きオブジェクトを削除します。

トレーニング データのエクスポート

サンプルを収集したら、[トレーニング データのエクスポート] タブをクリックして、サンプルをトレーニング データにエクスポートできます。その後、トレーニング データをディープ ラーニング モデルで使用できます。パラメーターを入力したら、[実行] をクリックしてトレーニング データを作成します。

パラメーター説明

出力フォルダー

トレーニング データを保存する出力フォルダーを選択します。

マスク ポリゴン フィーチャ

画像チップが作成される領域を描画するポリゴン フィーチャクラス。

このポリゴンに完全に含まれる画像チップのみが作成されます。

イメージ形式

画像チップ出力のラスター形式を指定します。

  • TIFF。これがデフォルトです。
  • MRF (Meta Raster Format)。
  • PNG。
  • JPEG。

PNG および JPEG は、3 バンドまでサポートします。

タイル サイズ X

画像チップの X ディメンションのサイズ。

タイル サイズ Y

画像チップの Y ディメンションのサイズ。

ストライド X

次の画像チップを作成する際に X 方向に移動する距離。

ストライドがタイル サイズと等しい場合、オーバーラップは発生しません。ストライドがタイル サイズの半分と等しい場合は、50% のオーバーラップが発生します。

ストライド Y

次の画像チップを作成する際に Y 方向に移動する距離。

ストライドがタイル サイズと等しい場合、オーバーラップは発生しません。ストライドがタイル サイズの半分と等しい場合は、50% のオーバーラップが発生します。

回転角度

追加の画像チップを生成するために使用する回転角度。画像チップは、0 の回転角度 (つまり、回転しない) で生成されます。その後、画像チップは、追加の画像チップを作成するために、指定した角度で回転されます。データ拡大のために、同じトレーニング サンプルが、複数の角度の複数の画像チップで取得されます。デフォルトの回転角度は 0 です。

フィーチャなしのタイルを出力

トレーニング サンプルをキャプチャしない画像チップをエクスポートするかどうかを指定します。

  • オフ - トレーニング サンプルを取得する画像チップのみをエクスポートします。これがデフォルトです。
  • オン - トレーニング サンプルを取得しないものも含め、すべての画像チップをエクスポートします。

メタデータ形式

出力メタデータ ラベルの形式を指定します。

トレーニング データの出力メタデータ ラベルのオプションは、[KITTI] の四角形、[PASCAL VOC] の四角形、[分類タイル] (クラス マップ)、[RCNN マスク]、[ラベル付きタイル]、[複数のラベル付きタイル]、[タイルのエクスポート] です。入力トレーニング サンプル データが建物レイヤーなどのフィーチャクラス レイヤーまたは標準分類トレーニング サンプル ファイルの場合、KITTI または PASCAL VOC の四角形オプションを使用します。出力メタデータは、最小境界範囲内のトレーニング サンプル データを含む *.txt ファイルまたは *.xml ファイルです。メタデータ ファイルの名前は、入力ソース画像名と一致します。入力トレーニング サンプル データがクラス マップの場合、出力メタデータ形式として [分類タイル] オプションを使用します。

  • KITTI ラベル - メタデータは、KITTI (Karlsruhe Institute of Technology and Toyota Technological Institute) オブジェクト検出評価データセットと同じ形式に従います。KITTI データセットは、Vision Benchmark Suite です。ラベル ファイルは、プレーン テキスト ファイルです。数値および文字列のすべての値はスペースで区切られ、各行は 1 つのオブジェクトと対応しています。
  • PASCAL Visual Object Classes - メタデータは、PASCAL VOC (Pattern Analysis, Statistical Modeling and Computational Learning, Visual Object Classes) データセットと同じ形式に従います。PASCAL VOC データセットは、オブジェクト クラスの認識のために標準化された画像データセットです。ラベル ファイルは XML ファイルで、画像名、クラス値、境界四角形に関する情報が含まれています。これがデフォルトです。
  • 分類済みタイル - 1 つの入力画像チップにつき、分類された画像チップが 1 つ出力されます。各画像チップに対してその他のメタデータは使用されません。統計出力だけに、クラスに関する詳細情報 (クラス名、クラス値、出力統計など) が含まれます。
  • RCNN マスク - サンプルが存在する領域にマスクが含まれる画像チップが出力されます。このモデルは、画像内のオブジェクトの各インスタンスに対して、境界四角形とセグメンテーション マスクを生成します。ディープ ラーニング フレームワーク モデルの FPN (Feature Pyramid Network) と ResNet101 バックボーンに基づいています。
  • ラベル付きタイル - 各出力タイルは、特定のクラスでラベル付けされます。このメタデータ形式を選択した場合、[フィーチャの周囲を黒く表示] パラメーターおよび [トリミング モード] パラメーターを詳細に調整できます。

KITTI メタデータ形式では 15 個の列が作成されますが、そのうちツールで使用されるのは 5 つのみです。最初の列はクラス値です。次の 3 つの列はスキップされます。5 ~ 8 番目の列は、4 つの画像座標位置 (上下左右のピクセル) で構成される最小境界範囲を定義します。最小境界範囲には、ディープ ラーニング分類器に使用されるトレーニング チップが含まれます。残りの列は使用されません。

フィーチャの周囲を黒く表示

それぞれの画像ファイル内で各オブジェクトまたはフィーチャの周囲のピクセルをマスクするかどうかを指定します。

  • オフ - オブジェクトまたはフィーチャの周囲のピクセルがマスクされません。これがデフォルトです。
  • オン - オブジェクトまたはフィーチャの周囲のピクセルがマスクされます。

このパラメーターは、メタデータ形式が [ラベル付きタイル] に設定されており、入力フィーチャクラスまたは分類ラスターが指定されている場合にのみ適用されます。

トリミング モード

エクスポートされたタイルがすべて同じサイズになるようにトリミングするかどうかを指定します。

  • 固定サイズ - エクスポートされたタイルが同じサイズになり、フィーチャが中央に配置されます。これがデフォルトです。
  • 境界四角形 - タイル内のフィーチャだけが境界ジオメトリで囲まれるように、エクスポートされたタイルがトリミングされます。

このパラメーターは、メタデータ形式が [ラベル付きタイル] に設定されており、入力フィーチャクラスまたは分類ラスターが指定されている場合にのみ適用されます。

参照系

入力画像を解釈するために使用する参照系のタイプを指定します。指定する参照系は、ディープ ラーニング モデルをトレーニングするために使用する参照系と一致する必要があります。

  • マップ空間 - 入力画像はマップベースの座標系です。これがデフォルトです。
  • ピクセル空間 - 入力画像は画像空間内で回転も変形もされません。

これで、エクスポートされたトレーニング データが、ディープ ラーニング モデル内で使用できるようになりました。

関連トピック