オブジェクトの分類—ArcGIS Pro

Image Analyst ライセンスで利用できます。

[ディープラーニングを使用したオブジェクトの分類 (Classify Objects Using Deep Learning)] ツールを使用して、画像内のオブジェクトを分類します。このツールは、入力ラスターに対してトレーニング済みのディープラーニングモデルを実行します。各入力フィーチャにはクラスラベルが割り当てられます。下の画像は、ディープラーニングツールを使用したオブジェクト分類の例です。

ディープラーニングを使用した通常のオブジェクト分類ワークフローは、主に以下の 3 つのステップで構成されます。

トレーニングサンプルを作成し、エクスポートします。ディープラーニングのオブジェクトのラベル付けウィンドウを使用してトレーニングサンプルを作成し、[ディープラーニング用のトレーニングデータをエクスポート (Export Training Data For Deep Learning)] ツールを使用して、サンプルをディープラーニングトレーニングデータに変換します。
ディープラーニングモデルをトレーニングします。 [ディープラーニングモデルのトレーニング (Train Deep Learning Model)] ツールで、前のステップで作成したトレーニングサンプルを使用してモデルをトレーニングします。
推論を実行します。 [ディープラーニングを使用したオブジェクトの分類 (Classify Objects Using Deep Learning)] ツールを使用します。ステップ 2 で作成したモデルを使用します。

その他の例、サポート対象のメタデータ形式、モデルタイプアーキテクチャーについては、「ディープラーニングモデルのアーキテクチャ」をご参照ください。

トレーニングサンプルを作成し、エクスポートする

トレーニングスキーマとトレーニングサンプルを作成し、トレーニングデータをエクスポートします。

ラスターデータセットまたはフィーチャクラスに既存のトレーニングサンプルがある場合は、[ディープラーニング用のトレーニングデータをエクスポート (Export Training Data For Deep Learning)] ツールを使用して、以下のディープラーニングモデルのトレーニングセクションに進むことができます。

トレーニングスキーマを作成します。
1. トレーニングサンプルの生成に使用する画像をマップに追加します。
2. [コンテンツ] ウィンドウで、追加した画像を選択します。
3. [衛星画像] タブをクリックします。
4. [ディープラーニングツール] をクリックし、[ディープラーニングに使用するラベルオブジェクト] をクリックします。
  [画像分類] ウィンドウに、空白のスキーマが表示されます。
5. [画像分類] ウィンドウで、[新しいスキーマ] を右クリックし、[プロパティの編集] をクリックします。
6. スキーマに名前を付けます。
7. [保存] をクリックします。
スキーマに新しいクラスを追加します。
1. 作成したスキーマを右クリックして、[新しいクラスの追加] を選択します。
2. クラスに名前を付けます。
3. クラスの値を指定します。
  値を 0 にすることはできません。
4. 必要に応じて、クラスの色を選択します。
5. [OK] をクリックします。
  [画像分類] ウィンドウで、クラスがスキーマに追加されます。
6. 必要に応じて、ステップ 2a 〜 2e を繰り返し、クラスをさらに追加します。
トレーニングサンプルを作成します。
1. [画像分類] ウィンドウで、トレーニングサンプルを作成したいクラスを選択します。
2. [ポリゴン] などの描画ツールを選択します。
3. 分類したいピクセルの周囲にポリゴンを描画します。
  新しいレコードが [画像分類] ウィンドウの [ラベル付きオブジェクト] グループに追加されます。
4. ステップ 3a から 3c を繰り返して、すべてのクラス用のトレーニングサンプルを作成します。
  最終モデルでは指定したオブジェクトのサイズが考慮されるため、さまざまなサイズのオブジェクトを選択できます。
サンプルを作成したら、[画像分類] ウィンドウの [保存] をクリックします。
1. [現在のトレーニングサンプルの保存] ウィンドウで、ジオデータベースを参照します。
2. フィーチャクラスの名前を指定し、[保存] をクリックします。
モデルをトレーニングする前に、トレーニングサンプルを画像チップとしてエクスポートする必要があります。画像チップは、検出可能なオブジェクトを 1 つ以上含む小さな画像です。画像チップは、スキーマのクラスの各トレーニングサンプルに対し作成され、ラベルが付けられます。
[画像の分類] ウィンドウで、[トレーニングデータのエクスポート] タブをクリックします。
1. [出力フォルダー] の値を指定します。
  これが、出力画像チップとメタデータを格納するフォルダーのパスと名前になります。
2. 必要に応じて、[メタデータ形式] の値を選択します。
  フィーチャ分類器モデルタイプでサポートされているメタデータ形式は、ラベル付きタイル、Imagenet、複数ラベル付きタイルです。
3. [実行] をクリックして、トレーニングデータをエクスポートします。

ディープラーニングモデルのトレーニング

[ディープラーニングモデルのトレーニング (Train Deep Learning Model)] ツールは、ラベル付けされた画像チップを使用して、オブジェクトを表す各画像内のピクセルの組み合わせを判別します。これらのトレーニングサンプルを使用して、ディープラーニングモデルをトレーニングします。このツールでは、[入力トレーニングデータ] パラメーターと [出力モデル] パラメーターのみが必須です。

入力トレーニングデータは [メタデータ形式] の値に基づいているため、適切な [モデルタイプ] のデフォルト値が決定されます。たとえば、エクスポートプロセスで [ラベル付きタイル] メタデータ形式を指定した場合、[モデルタイプ] パラメーターで [フィーチャ分類器] オプションが指定されます。 [モデルタイプ] ドロップダウンリストも、[ラベル付きタイル] メタデータ形式をサポートするモデルタイプを反映した形で更新されます。 [バッチサイズ]、[モデル引数]、[バックボーンモデル] の各パラメーターにも、[モデルタイプ] パラメーターの値に基づき値が入力されます。

[ディープラーニングモデルのトレーニング (Train Deep Learning Model)] ツールを開きます。
[入力トレーニングデータ] パラメーターで、画像チップが格納されているトレーニングデータフォルダーを参照して選択します。
[出力モデル] パラメーターに、トレーニング後の出力モデルを保存するフォルダーのファイルパスと名前を指定します。
必要に応じて、[最大エポック] パラメーターに値を指定します。
エポックとは、トレーニングデータセットを処理する完全な 1 サイクルをいいます。エポックごとに、画像チップフォルダーに保存したトレーニングデータセットがニューラルネットワークを通って前方/後方に 1 回渡されます。一般的に、初期レビューには 20 ～ 50 エポックが使用されます。デフォルト値は 20 です。モデルをさらに改善できる場合は、同じツールを使用して再トレーニングできます。
[モデルタイプ] パラメーターのドロップダウンリストで [フィーチャ分類器 (オブジェクト分類)] の値が選択されていることを確認します。
モデルタイプによって、[フィーチャ分類器] モデルアーキテクチャーなど、モデルのトレーニングに使用されるディープラーニングアルゴリズムとニューラルネットワークが決まります。モデル、サポート対象のメタデータ、モデルアーキテクチャーの詳細については、「ディープラーニングモデルのアーキテクチャー」と「ArcGIS のディープラーニングモデル」をご参照ください。
必要に応じて、[モデル引数] パラメーター値を変更します。
[モデル引数] パラメーターに、モデル定義の情報が入力されます。これらの引数は、指定されたモデルアーキテクチャーによって変わります。ツールでサポートされているモデル引数のリストは、[モデル引数] パラメーターで使用できます。
必要に応じて、[バッチサイズ] パラメーター値を設定します。
このパラメーターでは、一度にトレーニングされるトレーニングサンプルの数を指定します。バッチサイズの値は、画像チップの数、GPU メモリー (GPU が使用されている場合)、カスタム値が使用されている場合の学習率など、さまざまな要因によって決まります。デフォルトのバッチサイズを使用すると、通常は良好な結果が得られます。
必要に応じて、[学習率] パラメーター値を指定します。
値を指定しないと、トレーニングプロセス中に最適な学習率が学習曲線から抽出されます。
必要に応じて、[バックボーンモデル] パラメーター値を指定します。
デフォルト値はモデルアーキテクチャーに基づきます。ドロップダウンリストを使用して、デフォルトのバックボーンモデルを変更できます。
必要に応じて、[事前トレーニング済みモデル] パラメーター値を指定します。
類似したクラスを持つ事前トレーニング済みモデルは、新しいモデルに合わせて微調整することができます。事前トレーニング済みモデルは、新しいモデルのトレーニングに使用される同じモデルタイプおよびバックボーンモデルでトレーニングされている必要があります。
必要に応じて、[検証 %] パラメーター値を変更します。
これが、モデルの検証に使用するトレーニングサンプルの割合になります。この値は、トレーニングサンプルの数やモデルアーキテクチャーなど、さまざまな要因によって異なります。一般的に、トレーニングデータの量が少ない場合、検証には 10% 〜 20% を使用するのが適切です。数千サンプルのような大量のトレーニングデータが存在する場合、検証には 2% 〜 5% 程度の低い割合のデータを使用するのが適切です。デフォルト値は 10 です。
必要に応じて、[モデルが改善しなくなったら停止] パラメーターをオンにします。
オンにすると、指定した [最大エポック] 値にかかわらず、モデルの改善がなくなった時点でモデルのトレーニングを停止します。デフォルト設定はオンです。
必要に応じて、[モデルの固定] パラメーターをオンにします。
このパラメーターは、事前トレーニング済みモデルのバックボーン層が固定されるかどうかを指定します。これにより、ウェイトとバイアスが本来の設計どおりになります。このパラメーターをオンにすると、バックボーン層が固定され、事前定義済みのウェイトとバイアスは [バックボーンモデル] パラメーターで変更されません。このオプションをオフにすると、バックボーン層は固定されず、トレーニングサンプルに合わせて [バックボーンモデル] パラメーター値のウェイトとバイアスを変更できます。この処理には時間がかかりますが、通常は優れた結果が得られます。デフォルト設定はオンです。
[実行] をクリックして、トレーニングを開始します。

推論の実行

推論は、ディープラーニングトレーニングの最中に学習された情報を使用して、入力画像内の各検出オブジェクトにクラスまたはカテゴリーラベルを割り当てるプロセスです。オブジェクト分類ワークフローを実施するため、[ディープラーニングを使用したオブジェクトの分類 (Classify Objects Using Deep Learning)] ツールを使用します。

[ディープラーニングを使用したオブジェクトの分類 (Classify Objects Using Deep Learning)] ツールを開きます。
[入力ラスター] パラメーターで、分類したい入力ラスターデータを参照して選択します。
この入力には、モザイクデータセット、イメージサービス、画像のフォルダー、または画像の添付ファイルを含むフィーチャクラス内の単一のラスターデータセットまたは複数のラスターを指定することができます。
[出力分類オブジェクトフィーチャクラス] パラメーターで、出力フィーチャクラスの名前を付けます。
出力フィーチャクラスには、入力画像内の検出オブジェクトを取り囲むジオメトリーのほか、カテゴリー分けラベルを保存するためのフィールドが含まれます。
[モデル定義] の値を指定します (*.emd または *.dlpk ファイル)。
これが、トレーニング出力を含むモデルファイルになります。これが、ディープラーニングのトレーニングセクションの出力になります。
[引数] パラメーターで、デフォルト値を承諾するか、変更します。
[引数] パラメーターに [モデル定義] パラメーターの情報が入力されます。これらの引数は、指定されたモデルアーキテクチャーによって変わります。この例では、[フィーチャ分類器] モデルアーキテクチャーが使用されるため、以下の引数に情報が入力されます。
1. batch_size - モデル推論の各ステップで処理された画像タイルの数。この値はグラフィックスカードのメモリーサイズに応じて異なります。
2. test_time_augmentation - 予測中にテスト時間の延長を実行します。 true の場合、入力画像の反転および回転バリアントの予測は、最終出力にマージされます。
[実行] をクリックして推論を実行します。

トレーニング サンプルを作成し、エクスポートする

ディープ ラーニング モデルのトレーニング

推論の実行

関連トピック

このトピックの内容

トレーニングサンプルを作成し、エクスポートする

ディープラーニングモデルのトレーニング