点群分類用のディープラーニングモデルのトレーニング—ArcGIS Pro

点群の分類に使用されるディープラーニングモデルを作成するには、トレーニングデータの準備と、実際のトレーニングの 2 つの主なステップがあります。自分でトレーニングデータを用意しなくてはならないため、一般的に前半のステップに大きな困難が伴います。トレーニングデータを用意すると、残りのほとんどの作業はコンピューターが実施します。

トレーニングデータは、ニューラルネットワークの学習用サンプルとして提供する分類済みのポイントです。通常、サンプルが多いほどトレーニングの効果も高くなります。できるだけ正確なサンプルが必要なので、正確さに細心の注意を払うことが重要です。分類の範囲は、アプリケーションで使用するフィーチャや地形エレメントにする必要があります。また、汎用性の高いモデルを作成できるよう、トレーニングデータには多様性が必要です。さらに、より現実的なパフォーマンス指標を得るためには、検証データの多様性も必要になります。多様性があれば、より良好なトレーニング結果を得られます。

通常、点群にはレーザーや写真に捕捉されたあらゆるもののサンプルが含まれています。すべてのポイントを特定の物として分類することは現実的ではなく、また望ましくありません。必要なのは、対象ポイントを正確に分類することです。背景にある他のポイントや、対象以外のポイントは、クラスとして残しておくことができます。たとえば、送電線、植生、ビルディングを対象としている場合は、それらを正しく分類する必要があります。他のすべてのポイントは未分類にしておくことができます (たとえば、LAS 形式の LIDAR をクラス 1 とするなど)。

トレーニングに使用するデータ量については、ルールは特に決められていません。一般的に、提供するサンプルが多いほど良いとされています。当然、現実的な限界はありますし、努力が報われないこともあります。

トレーニングデータの準備

トレーニングを行うには、分類したいデータを適切に表す点群が必要です。トレーニングデータと同じプロジェクトの一部として、同じハードウェア仕様と同じ収集環境から、分類したいデータを収集することが理想です。そうすることで、成功の確率を高めることができます。他のデータを使用することもできますが、トレーニングデータと特徴を揃えておくことをお勧めします。名目ポイント間隔および密度は重要な要素です。位置正確度も重要です。モデル予測の精度を高めるために、LIDAR リターン番号や強度などのポイント属性をトレーニングに含める場合は、これらの属性が分類の対象となるデータに存在することを確認します。

トレーニングデータは、手動でも自動でも分類できます。対話形式の LAS クラスコード編集ツールと、一連のルールベースの分類指標があります。場合によっては、これらを組み合わせると便利です。たとえば、[LAS の地表分類 (Classify LAS Ground)] ジオプロセシングツールと [LAS の建物分類 (Classify LAS Building)] ジオプロセシングツールを使用し、基本的な分類を確立します。次に、代表的なサブエリアまたはタイル (タイル化された LAS を使用する場合) を、トレーニングサイトとしてデータセットから選択します。これらのエリアを手動でクリーンアップし、必要であれば他のクラスを追加します。編集し、改良したこれらのサブエリアを、トレーニングデータとして使用します。

検証データも必要です。検証データは、トレーニング時にモデルをバイアスなく評価するために使用され、過剰適合を特定し、回避するうえで有益です。過剰適合とは、モデルがトレーニングデータでは正常に動作するものの、他のデータでは動作しない状態を指します。検証データは、代表的な対象エリアを網羅する点と、同じ分類スキーマを使用する点はトレーニングデータと似ていますが、取得される場所が異なります。トレーニングと同じプロジェクトデータを使用できますが、サブセットは異なります。一般的に、検証データよりも多くのトレーニングデータが必要です。決まったルールはありませんが、トレーニングデータを検証データの数倍使用することは珍しくありません。

DEM などの参照サーフェスを使用して、相対高度属性をトレーニングデータに追加するとします。車両、街路灯、交通標識などの多数の対象フィーチャが一定の高さの範囲に存在します。地表自体の標高は場所によって大きく変化しますが、地表を基準にしたこれらのフィーチャの高さはそれほど大きくは変わりません。この点で、ポイントごとに記録される地表からの相対高度の属性に基づいて、ポイントが属するフィーチャ (クラス) のタイプを予測することができます。

指定したポイントをトレーニングから除外できます。たとえば、ノイズとして分類されたポイントは悪影響があるため除外する必要があります。さらに、参照サーフェスを使用してポイントの相対高度属性を追加する場合、地表ポイントを除外することで、使用されるポイントの数を減らすことができます。これにより、トレーニングに必要な時間が短縮されます。

トレーニングデータと検証データを定義すると、トレーニングの評価ポイントとして使用する適切なサンプリング近傍やブロックサイズを特定する必要があります。

ブロックサイズ

トレーニングデータと検証データは、管理しやすい小さいブロックに分割されます。ブロックは投影座標と非投影 (十進経緯度など) 座標の両方でデータを管理するために円形の形状をしています。これらのポイントのブロックを、ディープラーニングライブラリでアクセスできる形式に配置します。適切なブロックサイズを決定します。ブロックサイズの目標は、利用可能な GPU メモリに対して適切な数のポイントを含めることです。トレーニングでは、[バッチサイズ] と呼ばれるトレーニングパラメーターで設定されたブロック数に準じて、ポイントと 2 次的なデータ構造が読み込まれます。ここで、複数の変数の相互作用に注意する必要があります。バッチは、一度に処理するブロック数を制御します。ブロックとは、一連のポイントとその属性を指します。ブロックに含まれるポイント数は、ブロックのサイズと、ブロックの場所のポイント密度によって決定します。点群の密度が一定であれば、ブロックには比較的一貫した数のポイントが含まれます。ポイント密度に大きな差異があるデータセットを使用することもできますが、うまく機能させるにはより多くのトレーニングが必要となります。

ブロック内のポイント数の推定値は平均的には正しくなるかもしれませんが、必ず分散があるので、ブロックのポイント数に上限を設定する必要があります。そのためには、ブロックポイント制限パラメーターを使用します。ブロックに含まれるポイント数がこの値を超過すると、すべてのデータを確実に使用するために、同じ位置に対して複数のブロックが作成されます。

たとえば、平均でおよそ 8,000 個のポイントを含むようサイズ設定されたブロックを使用します。

ブロックサイズ (ブロックの直径) を予測するには、データの名目ポイント間隔 (ポイント密度) と、1 つのブロックに必要なポイント数を把握しておく必要があります。

ポイント密度 = 1 / (ポイント間隔)

ブロック面積 = ブロックに必要なポイント数 / ポイント密度

ブロック サイズ = 2 * ((ブロック面積 / Pi) の平方根)

ブロックサイズを評価する場合は、対象のオブジェクトやフィーチャのサイズも考慮する必要があります。たとえば、フィーチャが上記で予測したブロックサイズよりも大幅に小さい場合は、フィーチャに合わせてブロックサイズを小さくすることもできます。

8 GB の専用 RAM を持つ GPU では、デフォルトのバッチサイズ (2) を使用して、一度に 2 ブロック相当のポイントを GPU に読み込みます。 GPU のメモリ使用状況を監視します。トレーニング中に多くの使用可能な GPU メモリが残っている場合は、バッチサイズを大きくして、一度に処理できるブロック数を増やすことができます。

トレーニング

トレーニングでは、トレーニングデータと検証データを使用して CNN (畳み込みニューラルネットワーク) を作成します。それによって生成されるモデルは、「推論」と呼ばれる処理を通じて、LAS 形式の点群を分類します。 RandLANet、SQN、および PointCNN は、ArcGIS によってトレーニングと分類に使用されるディープラーニングアーキテクチャです。独自のデータでモデルを使用することも、他のユーザーのデータで使用できるよう共有することもできます。トレーニング処理は大量のリソースを使用するため、時間がかかることがあります。幸いなことに、結果はコンパクトにまとめられます。モデル自体のサイズは、通常、15 ～ 20 MB です。

出力モデルは複数ファイルで構成され、出力フォルダーに格納されます。これには、パラメーター設定を含む JSON ファイルである Esri モデル定義 (*.emd) ファイル、*.pth データファイル、トレーニング結果の評価時に確認する追加ファイルが含まれます。ディープラーニングパッケージ (*.dlpk) もフォルダーに出力されます。共有と公開を行えるよう、すべての関連ファイルが 1 つのフォルダーにパッケージ化されています。

デフォルトでは、モデルをゼロからトレーニングしますが、処理の中でトレーニング済みのモデルを含めることができます。その場合は、既存のモデルに改良を加えて、新しいモデルを生成します。トレーニングを追加で実施することでサンプル数が増えるため、ポイントの正しい分類を予測するモデルの機能が向上します。

トレーニングツールの、[ブロックごとの最小ポイント数] 設定は、ポイントが十分に含まれていないトレーニングブロックをスキップするために使用されます。多くの場合、プロジェクト周長のブロックにはあまりポイントがありません。さらに、トレーニングデータを作成するときに、1 つ以上のブロックでブロック制限値に達することがあります。それ以降のブロックはオーバーフローポイントを保持するために作成されます。いずれにせよ、ポイント数が比較的少ないブロックはあまり有用性がないため、トレーニング処理に含めないことをお勧めします。

クラスの管理

[点群分類モデルのトレーニングを実行 (Train Point Cloud Classification Model)] ジオプロセシングツールの [クラスの管理] カテゴリには、クラスの再マッピング、対象クラス、クラスの命名に関するパラメーターが含まれています。

クラスの再マッピングは、出力モデルで異なるクラスコードや、入力トレーニングデータに関連する意味を使用する必要がある場合に便利です。また、クラスのマージにも便利です。たとえば、3 つの植生クラスを 1 つにまとめる場合などです。

対象のクラスコードがトレーニングの焦点となります。デフォルトでは、入力トレーニングデータのすべてのクラスを使用してモデルを作成します。関心があるフィーチャのクラスまたはタイプが 1 つだけである場合、複数のクラスがあるとトレーニングが無用に複雑になることがあります。たとえば、送電線の導線を分類するモデルを作成するだけであれば、それだけを対象コードに設定できます (LAS 標準に準じてクラス 14 など)。その場合は、バックグラウンドクラスコードを指定するように求められます。それがすべてのコードになります。したがって、トレーニングデータに含まれるクラスが多くても、トレーニング済みのモデルは 2 つのクラス (対象クラスとバックグラウンド) を分類する方法だけを把握していることになります。

トレーニングパラメーター

[点群分類モデルのトレーニングを実行 (Train Point Cloud Classification Model)] ジオプロセシングの [トレーニングパラメーター] カテゴリには、関連するデータやクラスではなく、トレーニング処理自体に固有のパラメーターが含まれます。

トレーニングは反復的なプロセスです。条件が満たされるまで、データのパスが繰り返し行われます。その条件の 1 つに、[エポックの最大数] があります。エポックとは、トレーニングデータの 1 回のパスを表します。エポック内で、データはバッチで処理されます。バッチとは、1 つ以上のブロックのコレクションのことです。エポックあたりの反復とは、エポック内で処理されるバッチの割合のことです。したがって、100 パーセント未満を指定すると、バッチのサブセットが処理されます。バッチサイズとは、バッチ内のブロック数を指します。バッチ内のブロックは並行処理されます。お使いの GPU の専用 RAM が十分であれば、大きいバッチサイズを使用してトレーニングを実施できます。これにより、トレーニングにかかる全体的な時間を短縮できます。

学習率

学習率とは、損失を最小限に抑える目標の達成に向けてモデルの重みを更新するたびにモデルをどれだけ調整するかを制御する調整パラメーターです。新しい情報が古い情報をどの程度上書きするかを左右することから、モデルの学習速度を表します。

学習率を決定するには、トレードオフが発生します。つまり、値が小さすぎるとトレーニング時間が長くなり、モデルが行き詰まる可能性もあります。一方で値が大きすぎると、最適ではない重みを学習することになり、学習処理も不安定になります。

学習率の初期値を見出すことは容易ではありません。 [点群分類モデルのトレーニングを実行 (Train Point Cloud Classification Model)] ツールで、値を推定できます。モデルの初回トレーニング時には、空白にしておくことをお勧めします (デフォルト設定)。ツールが学習率を推定します。 [点群分類モデルのトレーニングを実行 (Train Point Cloud Classification Model)] ツールのメッセージに学習率が記されます。また、model_metrics.html という名前のファイルでも学習率が示され、トレーニング処理が完了したときに出力モデルフォルダーに書き込まれます。 [点群分類モデルのトレーニングを実行 (Train Point Cloud Classification Model)] ツールで生成した結果の詳細については、「点群トレーニング結果の評価」をご参照ください。

トレーニング データの準備

ブロック サイズ

トレーニング

クラスの管理

トレーニング パラメーター

学習率

関連トピック

このトピックの内容

トレーニングデータの準備

ブロックサイズ

トレーニングパラメーター