ラベルとトレーニング データの確認

Image Analyst ライセンスで利用できます。

Spatial Analyst のライセンスで利用可能。

ディープ ラーニング モデルをトレーニングする際、トレーニング データの品質が重要になります。 ArcGIS Pro には、ラベルまたはエクスポートされたトレーニング データをユーザーが確認、承認、拒否、更新するためのツールが用意されています。 これらのツールは、目視での手動レビューと、定量的評価に基づく自動レビューの両方を行えます。

ラベル タブ

オブジェクトにラベルを付けたら、ラベル付けのエラーを確認するために、手動での品質保証 (QA) レビューを行えます。 [ラベル] タブには、ラベルを確認、承認、拒否、編集するためのツールが用意されています。 QA 処理には、2 つのタイプのユーザーが関与します。

  • レビューアー - ラベルの承認または拒否のみを行えるレビューアー。
  • エディター - ラベルの承認、拒否、編集を行えるエディター。

[ラベル] タブのツールは、レビューアーとエディターの両方が使用できます。各ツールの説明を次の表に示します:

ツール説明

トレーニング サンプルの読み込み

トレーニング サンプルの読み込み

既存のトレーニング サンプル フィーチャクラスを開いてレビューします。

保存

保存

現在のフィーチャクラスに対する編集内容を保存します。

名前を付けて保存

名前を付けて保存

編集内容を新しいフィーチャクラスとして保存します。

承認

承認

選択したラベルを承認します。

除外

除外

選択したラベルを拒否します。

削除

削除

選択したラベルを削除します。

編集

編集

選択したトレーニング サンプルの形状を編集します。

ウィンドウの下部に、ラベル フィーチャクラスのすべてのレコードが表形式で表示されます。 ラベルごとに、次のように、クラス名、現在のステータス、報告されている問題が表示されます:

  • [クラス名] - 各ラベルのクラス名がリストされます。 各クラス名を変更したり、新しいクラス名を追加したりすることができます。
  • [ステータス] - レビュー プロセスにおけるラベルの現在のステータスが表示されます。 デフォルトでは、すべてのラベルのステータスが [保留中] に設定されています。 レビューアーはこのステータスを [承認] または [拒否] に変更できます。
  • [問題] - レビュー プロセスでラベルが拒否された理由が表示されます。 ラベルを拒否した場合、レビューアーはそのラベルを拒否した理由を選択します。 [誤ったラベル][形状の不良] から選択できます。

注意:

テーブルで 1 つまたは複数の行を選択すると、レビューしやすくするためにマップがラベルにズームします。 これは、複数のラベルをレビュー対象として選択した場合に特に便利です。

データ タブ

オブジェクトにラベルを付け、トレーニング データがエクスポートされたら、QA レビューを開始できるようになります。 [データ] タブには、ラベルおよびエクスポートされた画像チップのエラーをすばやく目視チェックするためのツールが用意されています。 ギャラリーに、各画像チップのクラス名と境界四角形が表示されます。 この段階で、レビューアーは、エクスポートされたトレーニング データの品質を評価し、プロジェクトのニーズを満たしているかどうかを確認します。 発生しうる問題には、画像チップが大きすぎるか小さすぎる、ラベルが欠落している、ラベルが完全ではない、オーバーラップが不足していることなどが挙げられます。 画像チップのサムネイルを選択すると、ギャラリーの下の [プレビュー] ウィンドウに画像チップがフル サイズで表示されます。

注意:

現在、[データ] タブはオブジェクト検出のトレーニング データのみサポートしています。

次の表で、[データ] タブのツールについて説明します。

ツール説明

トレーニング データの読み込み

トレーニング データの読み込み

トレーニング データをフォルダーから読み込みます。

クラス

クラス ドロップダウン リスト

トレーニング データのフィルターに使用するクラスを選択します。

再生コントロール

再生コントロール

ナビゲーション コントロールと再生コントロールを使用して、エクスポートされた画像チップとそのラベルを表示できます。 ギャラリーに一度に表示される画像チップは 20 個だけですが、ナビゲーション ツールを使用して、どの画像チップを表示するかを制御できます。

  • [再生] ボタン 再生 をクリックすると、すべての画像チップが順番に表示されます。
  • [一時停止] ボタン 一時停止 をクリックすると、再生が一時停止します。
  • [速度] ドロップダウン リスト 速度コントロール リスト を使用して再生速度を制御します。 速度のオプションには 0.5x、1x、2x、3x があります。
  • 手動でレビューする場合、[最初] 最初[前へ] 前へ[次へ] 次へ[最後] 最後 ボタンを使用して、リスト内の一連の画像を切り替えます。

移動先

移動先

特定の画像に移動します。 テキスト ボックスに画像番号を入力し、[移動先] ボタンをクリックします。

自動確認タブ

大きいデータセットの場合、手動でのレビューは時間がかかるため、非効率的です。 [自動確認] タブのツールを使用すると、小規模なグラウンド トゥルース データと比較することで、ラベルの品質を迅速に評価できます。

オブジェクトの検出ラベル

[自動確認] タブは、グラウンド トゥルース データを使用し、オブジェクト検出ラベルを自動的に評価します。 このツールは、COCO (Common Objects in Context)、mAP (平均 AP)、精度 x 再現率曲線などの一連の正確度メトリクスを生成し、データの品質を評価します。 IoU (Intersection over a Union) 比率を使用して、真陽性と偽陽性および真陰性と偽陰性を識別してカウントし、データセットの評価に必要なすべての主要メトリクスを含む詳細レポートを出力します。

次の表に、オブジェクト検出の [自動確認] タブに関連するパラメーターを示します:

パラメーター説明

ラベル

[ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] で検出されたオブジェクトを含むポリゴン フィーチャクラス。

グラウンド トゥルース フィーチャ

グラウンド トゥルース データを含むポリゴン フィーチャクラス。

出力正確度テーブル

出力精度テーブル。

出力正確度レポート

出力精度レポートの名前。 レポートは、精度メトリクスとチャートを含む PDF ドキュメントです。

検出されたクラス値フィールド

検出されたオブジェクト フィーチャクラスのフィールドで、クラス値またはクラス名が含まれています。

フィールド名が指定されていない場合、Classvalue または Value フィールドが使用されます。 これらのフィールドが存在しない場合、すべてのレコードが 1 つのクラスに属するものとして識別されます。

クラス値またはクラス名は、地上参照フィーチャクラスの値と正確に一致している必要があります。

グラウンド トゥルースのクラス値フィールド

クラス値を含むグラウンド トゥルース フィーチャクラスのフィールド。

フィールド名が指定されていない場合、Classvalue または Value フィールドが使用されます。 これらのフィールドが存在しない場合、すべてのレコードが 1 つのクラスに属するものとして識別されます。

クラス値またはクラス名は、検出されたオブジェクト フィーチャクラス内のクラス値またはクラス名と正確に一致している必要があります。

最小 IoU (Intersection over Union)

オブジェクト検出モデルの精度を評価する閾値として使用される IoU 比率。 分子は、予測された境界四角形と地上参照境界四角形との間のオーバーラップの面積です。 分母は、和集合 (両方の境界四角形で囲まれた面積) です。 IoU の範囲は 0 ~ 1 です。

マスク フィーチャ

精度が計算される領域を描画するポリゴン フィーチャクラス。 マスクと交差するフィーチャのみが精度評価の対象になります。

ピクセルの分類ラベル

[自動確認] タブは、グラウンド トゥルース データを使用し、ピクセルの分類ラベルを自動的に評価します。 このツールは、オミッション エラーとコミッション エラーに基づく混同行列と、IoU スコアを計算します。 正確度はラベルとグラウンド トゥルース データ間で計算されます。ラベルはフィーチャクラスまたはラスター レイヤーのいずれかです。

次の表に、ピクセル分類の [自動確認] タブに関連するパラメーターを示します。

パラメーター説明

ラベル

入力分類ラスター。

グラウンド トゥルース データ

入力分類画像またはその他の主題 GIS の参照データ。 入力は、ラスターでもフィーチャクラスでもかまいません。

典型的なデータは、シングル バンド、整数データ タイプの分類画像です。

ポリゴンを入力として使用している場合、トレーニング サンプルとして使用されていないポリゴンのみを使用します。 シェープファイルまたはフィーチャクラス形式の GIS 土地被覆データも使用できます。

出力混同行列

表形式の混同行列の出力ファイル名。

テーブルの形式は、出力先とパスによって決定されます。 デフォルトでは、出力はジオデータベース テーブルです。 パスがジオデータベース内にない場合、.dbf 拡張子を使用して dBASE 形式で保存します。

ランダム ポイント数

生成されるランダムなポイントの合計数。

サンプリング処理やクラスの数に応じて、実際の数値はこれを超える場合がありますが、この数値を下回ることはありません。 ランダムに生成されたポイントのデフォルト数は 500 です。

サンプリング処理

使用するサンプリング方式を指定します。

  • [階層別ランダム] - 各クラス内にランダムに分散したポイントを作成します。各クラスには、相対的な面積に比例した、多数のポイントが含まれています。

  • [均等階層別ランダム] - 各クラス内にランダムに分散したポイントを作成します。各クラスのポイント数は同じです。
  • [ランダム] - 画像全体にランダムに分散したポイントを作成します。

最小ポイント間距離

リファレンス ポイント間の最小距離。

関連トピック