ディープラーニングモデルのトレーニングウィザードの使用—ArcGIS Pro

Image Analyst ライセンスで利用できます。

ディープラーニングモデルのトレーニングウィザードは、収集したトレーニングデータを使用してディープラーニングモデルをトレーニングできる補助ワークフローです。トレーニングデータを用意したら、[画像] タブの [ディープラーニングツール] ドロップダウンメニューディープラーニングツールの下にあるディープラーニングモデルのトレーニングウィザードディープラーニングモデルのトレーニングを開きます。

このウィザードには、[はじめに]、[トレーニング]、および [結果] の 3 つのページがあります。

ディープラーニングモデルのトレーニングウィザードを使用するには、次の手順を実行します。

[画像] タブをクリックします。
[ディープラーニングツール] ドロップダウンメニューをクリックして、[ディープラーニングモデルのトレーニング] を選択します。
[ディープラーニングモデルのトレーニング] ウィザードウィンドウが表示されます。

はじめに

ウィザードの [はじめに] ページで、ディープラーニングモデルのトレーニング方法を指定する必要があります。

モデルのトレーニング方法を指定します。
- [パラメーターを自動的に設定] - モデルのタイプ、パラメーター、およびハイパーパラメーターが自動的に設定され、最適なモデルが構築されます。
- [独自のパラメーターを指定] - モデルのタイプ、パラメーター、およびハイパーパラメーターをユーザー自身で設定してモデルを構築します。
[次へ] ボタンをクリックすると、[トレーニング] ページに移動します。

トレーニング

[トレーニング] ページで、トレーニングに使用するパラメーター情報を設定します。 [はじめに] ページで指定したオプションによって、パラメーターが異なる場合があります。

必要なパラメーターを指定します。

入力トレーニングデータ

モデルのトレーニングに必要な画像チップ、ラベル、統計情報を含むフォルダー。 [ディープラーニング用のトレーニングデータをエクスポート (Export Training Data For Deep Learning)] ツールからの出力です。

出力モデル

(自動トレーニング)

ディープラーニングパッケージ (.dlpk ファイル) として保存される出力トレーニング済みモデル。

出力フォルダー

(手動トレーニング)

トレーニング済みモデルが格納される出力フォルダーの場所。

必要に応じて、他のパラメーターを設定します。

自動トレーニングパラメーター


パラメーター	説明
事前トレーニング済みモデル	新しいモデルの微調整に使用される事前トレーニング済みモデル。入力は、Esri モデル定義ファイル (.emd) またはディープラーニングパッケージファイル (.dlpk) です。類似したクラスを持つ事前トレーニング済みモデルは、新しいモデルに合わせて微調整することができます。事前トレーニング済みモデルは、新しいモデルのトレーニングに使用される同じモデルタイプおよびバックボーンモデルでトレーニングされている必要があります。
合計時間の制限 (時間)	AutoDL モデルのトレーニングにかかる合計時間の制限 (時間単位)。デフォルトは 2 時間です。
自動 DL モード	使用される AutoDL モードと、AutoDL 検索の集約度を指定します。基本 - ハイパーパラメーター調整を行わずに、選択されたすべてのネットワークをトレーニングします。高度 - 上位 2 つの実行モデルにハイパーパラメーター調整を行います。
ニューラルネットワーク	モデルのトレーニングに使用されるアーキテクチャを指定します。デフォルトでは、すべてのネットワークが使用されます。
評価済みモデルの保存	すべての評価済みモデルを保存するかどうか指定します。オン - すべての評価済みモデルを保存します。オフ - 最善モデルのみを保存します。これがデフォルトです。

手動トレーニングパラメーター


パラメーター	説明
最大エポック	モデルをトレーニングする場合の対象となるエポックの最大数。最大エポックを 1 に設定すると、データセットがニューラルネットワークを通って前後に 1 回渡されます。デフォルト値は 20 です。
事前トレーニング済みモデル	新しいモデルの微調整に使用される事前トレーニング済みモデル。入力は、Esri モデル定義ファイル (.emd) またはディープラーニングパッケージファイル (.dlpk) です。類似したクラスを持つ事前トレーニング済みモデルは、新しいモデルに合わせて微調整することができます。事前トレーニング済みモデルは、新しいモデルのトレーニングに使用される同じモデルタイプおよびバックボーンモデルでトレーニングされている必要があります。
モデルタイプ	ディープラーニングモデルのトレーニングに使用されるモデルタイプを指定します。さまざまなモデルタイプの詳細については、「ディープラーニングモデルのアーキテクチャ」をご参照ください。
モデル引数	[モデルタイプ] パラメーターの情報は、このパラメーターに値を取り込むために使用されます。これらの引数はモデルアーキテクチャによって異なります。 ArcGIS でトレーニングされるモデルのサポート対象モデル引数を以下で説明します。 ArcGIS 事前トレーニング済みモデルとカスタムディープラーニングモデルでは、このツールでサポートされている追加の引数を利用できることがあります。各モデルタイプで利用可能な引数の詳細については、「ディープラーニングの引数」をご参照ください。
データ拡張	使用されるデータ拡張のタイプを指定します。データ拡張は、既存のデータを使用してデータセットの変更済みコピーを作成することで人為的にトレーニングセットを増やす手法です。デフォルト - デフォルトのデータ拡張パラメーターとデフォルト値が使用されます。デフォルトのデータ拡張手法は、crop、dihedral_affine、brightness、contrast、zoom です。これらのデフォルト値は通常、衛星画像に適しています。なし - データ拡張は行われません。カスタム - [拡張パラメーター] パラメーターで、ユーザーが定義するデータ拡張値を指定します。ファイル - トレーニングデータセットと整合チェックデータセットのデータ拡張のための fastai の変換を指定します。これらは transforms.json という .json ファイルで指定され、トレーニングデータと同じフォルダーに格納されています。さまざまな変換に関する詳細については、「fastai ビジョンの変換」をご参照ください。
拡張パラメーター	拡張パラメーター内の各変換の値を指定します。 rotate - 画像は、確率 (p) の分だけ無作為に (角度単位で) 回転します。角度が範囲 (a,b) の場合、値は、a から b の範囲で均等に割り当てられます。デフォルト値は 30.0; 0.5 です。 brightness - 画像の明るさは、確率 (p) を適用して、変化の値に応じて無作為に調整されます。変化が 0 の場合は画像が最も暗くなり、変化が 1 の場合は画像が最も明るくなります。変化が 0.5 の場合は、明るさは調整されません。変化が範囲 (a,b) の場合、拡張によって a から b の範囲の値が均等に割り当てられます。デフォルト値は (0.4,0.6); 1.0 です。 contrast - 画像のコントラストは、確率 (p) を適用して、スケールの値に応じて無作為に調整されます。スケールが 0 の場合は画像がグレースケールになり、スケールが 1 より大きい場合は画像がスーパーコントラストになります。スケールが 1 の場合は、コントラストが調整されません。スケールが範囲 (a,b) の場合、拡張によって a から b の範囲の値が均等に割り当てられます。デフォルト値は (0.75, 1.5); 1.0 です。 zoom - 画像がスケールの値に応じて無作為にズームインされます。ズームの値は、scale(a,b); p の形式を取ります。デフォルト値は (1.0, 1.2); 1.0 で、p は確率です。スケールが 1.0 を超える場合のみ、画像のズームインが行われます。スケールが範囲 (a,b) の場合は、a から b の範囲の値が均等に割り当てられます。 crop - 画像が無作為にトリミングされます。トリミングの値は、size;p;row_pct;col_pct の形式を取り、p は確率を表します。位置は (col_pct, row_pct),　によって与えられ、col_pct と row_pct は 0 ～ 1 に正規化されます。col_pct　または row_pct が範囲 (a,b) の場合は、a から b の範囲の値が均等に割り当てられます。デフォルト値は chip_size;1.0; (0, 1); (0, 1) で、224 がデフォルトのチップサイズとなります。
バッチサイズ	1 回のトレーニングで処理されるトレーニングサンプルの数。バッチサイズを大きくすると、ツールのパフォーマンスが向上しますが、バッチサイズが増加するにつれて、使用されるメモリ量が増加します。設定されたバッチサイズに対して GPU メモリが足りない場合、ツールが最適なバッチサイズを計算して使用するよう試みます。メモリ不足エラーが発生した場合は、より小さなバッチサイズを使用してください。
検証 %	モデルの検証に使用するトレーニングサンプルの割合。デフォルト値は 10 です。
チップサイズ	モデルをトレーニングするための画像のサイズ。画像は、指定のチップサイズにトリミングされます。画像サイズがパラメーター値より小さい場合は、画像サイズが適用されます。デフォルトサイズは 224 ピクセルです。
サイズ変更	画像のチップのサイズを変更します。チップのサイズを変更したら、チップサイズのピクセルブロックがトリミングされ、トレーニングに使用されます。このパラメーターは、オブジェクト検出 (PASCAL VOC)、オブジェクト分類 (ラベル付きタイル)、super-resolution データにのみ適用されます。サイズ変更の値は、多くの場合、チップサイズの半分です。このサイズ変更の値がチップサイズの値より小さい場合、サイズ変更の値は、トレーニング用ピクセルブロックの作成に使用されます。
学習率	トレーニング処理全体で、既存の情報を新たに取得した情報に上書きする割合。値を指定しないと、トレーニングプロセス中に最適な学習率が学習曲線から抽出されます。
バックボーンモデル	新しいモデルをトレーニングするアーキテクチャとして使用する、事前構成済みのニューラルネットワークを指定します。この方法は「転移学習」と呼ばれます。また、たとえば timm:resnet31、timm:inception_v4、timm:efficientnet_b3　などのように timm を接頭辞として使用することで、PyTorch Image Models (timm) でサポートされている畳み込みニューラルネットワークを指定できます。
監視指標	チェックポイントおよび早期停止中に監視する指標を指定します。
モデルが改善しなくなったら停止	早期停止を実施するかどうかを指定します。オン - 早期停止が実施され、指定した [最大エポック] パラメーター値にかかわらず、モデルの改善がなくなった時点でモデルのトレーニングを停止します。これがデフォルトです。オフ - 早期停止は実施されず、[最大エポック] パラメーター値に到達するまで、モデルのトレーニングが続行されます。
モデルの固定	事前トレーニング済みモデルのバックボーンレイヤーを固定するかどうかを指定します。これにより、ウェイトとバイアスが本来の設計どおりになります。オン - バックボーンレイヤーが固定され、事前定義済みのウェイトとバイアスを [バックボーンモデル] パラメーターで変更しません。これがデフォルトです。オフ - バックボーンレイヤーは固定されず、[バックボーンモデル] パラメーターのウェイトとバイアスを、トレーニングサンプルに合わせて変更できます。この処理には時間がかかりますが、通常は優れた結果が得られます。
加重初期化スキーマ	レイヤーの重みが初期化される Scheme を指定します。マルチスペクトルデータを使用してモデルをトレーニングするには、モデルが使用可能なさまざまなタイプのバンドに対応する必要があります。これは、モデルの第 1 レイヤーを再度初期化することで行われます。ランダム - 非 RGB バンドでは、ランダムな重みが初期化され、RGB バンドでは、事前トレーニング済みの重みが維持されます。これがデフォルトです。 Red バンド - 非 RGB バンドでは、事前トレーニング済みモデルのレイヤーの Red バンドに対応する重みのクローンが作成され、RGB バンドでは、事前トレーニング済みの重みが維持されます。すべてランダム - RGB バンドと非 RGB バンドで、ランダムな重みが初期化されます。このオプションは、マルチスペクトル画像にのみ適用されます。このパラメーターは、マルチスペクトル画像がモデルで使用される場合のみ適用されます。

[次へ] ボタンをクリックすると、[結果] ページに移動します。

結果

[結果] ページには、ユーザーが確認できるよう、トレーニングされたモデルの主要な情報が表示されます。また、トレーニングされたモデルを他のモデルと比較することもできます。推論時にディープラーニングモデルを使用する前に、ディープラーニングモデルを理解することが重要です。モデルを確認することで、モデルがどのようにトレーニングされたのか、どのように実行されるかがわかります。多くの場合、複数のモデルを比較することになります。


アイテム	説明
モデル	[参照] ボタンを使用すると、確認したいモデルを探すことができます。関連付けられたすべてのモデルが [モデル] ドロップダウンリストに追加されます。モデルを切り替え、ドロップダウンリストからモデルを削除できます。
モデルタイプ	モデルアーキテクチャの名前。
バックボーン	トレーニングモデル用のアーキテクチャとして使用された事前構成済みのニューラルネットワークの名前。
学習率	ニューラルネットワークのトレーニングに使用される学習率。この値を指定しなかった場合は、トレーニングツールにより値が計算されます。
トレーニングロスと検証ロス	このセクションには、モデルのトレーニング中に発生したトレーニングロスと検証ロスを示すグラフが表示されます。
モデルの解析	モデルアーキテクチャに応じて指標または数字。たとえば、ピクセル分類モデルには、各クラスについて精度、再現率、F1 スコアの各指標が表示されます。オブジェクト検出モデルには、平均精度スコアが表示されます。
サンプル結果	地上参照データと予測のペアの例を表示します。
エポックの詳細	トレーニングロス、検証ロス、時間、その他の指標など、各エポックの情報を格納したテーブル。

はじめに

トレーニング

自動トレーニング パラメーター

手動トレーニング パラメーター

結果

関連トピック

このトピックの内容

自動トレーニングパラメーター

手動トレーニングパラメーター