ディープラーニングの概要—ArcGIS Pro

ディープラーニングの概要

機械学習ツールは、数十年にわたって、GIS における空間解析の主要コンポーネントでした。ArcGIS で機械学習を使用して、画像分類を実行したり、クラスタリングを使用してデータに情報を付加したり、空間リレーションシップをモデル化することができました。機械学習は、問題を解くためにアルゴリズムを使用して構造化データが処理される、人工知能の一分野です。従来の構造化データでは、アルゴリズム内で動物の種類ごとに特定の特徴を理解し、他の写真内のそれらの動物の識別に使用できるように、人が猫や犬の写真などのデータにラベルを付ける必要があります。

ディープラーニングは、ニューラルネットワークの形式でアルゴリズムの複数のレイヤーを使用する機械学習のサブセットです。ネットワークの異なるレイヤーを介して入力データが解析され、各レイヤーがデータ内の特定の特徴およびパターンを定義します。たとえば、建物や道路などの特徴を識別する場合、ディープラーニングモデルは、さまざまな建物および道路の画像を使用してトレーニングされ、ニューラルネットワーク内のレイヤーを介して画像を処理し、その後、建物や道路を分類するために必要な識別子を見つけます。

Esri は、ディープラーニングにおける最新の技術革新を利用して、GIS およびリモートセンシングアプリケーションにおける難しい質問の一部に回答するためのツールおよびワークフローを開発しました。コンピュータービジョン、つまりデジタル画像またはビデオを理解するためのコンピューターの能力は、従来の機械学習アルゴリズムからディープラーニング手法に移行しつつある分野です。ディープラーニングを ArcGIS Pro で画像に適用する前に、コンピュータービジョン用のディープラーニングの異なるアプリケーションを理解することが重要です。

コンピュータービジョン用のディープラーニングのアプリケーション

ディープラーニングのニューラルネットワークを使用して実現できる多くのコンピュータービジョンのタスクが存在しています。Esri は、画像分類、オブジェクト検出、意味セグメンテーション、およびインスタンスセグメンテーションを実行できるツールを開発しました。以下では、それらのコンピュータービジョンのタスクのすべてについて、それぞれのリモートセンシングの例およびより一般的なコンピュータービジョンの例と共に説明します。

画像分類

画像分類は、ラベルまたはクラスをデジタル画像に割り当てることを含みます。たとえば、左下のドローン画像には群衆というラベルが付けられ、右のデジタル写真には猫というラベルが付けられます。このタイプの分類は、オブジェクト分類または画像認識とも呼ばれ、画像内の特徴を分類するために GIS において使用できます。

オブジェクトの検出

オブジェクトの検出は、画像内の特徴を特定する処理です。たとえば、下のリモートセンシング画像では、ニューラルネットワークが飛行機の位置を見つけました。さらに一般的なコンピュータービジョンの使用事例では、あるモデルは、さまざまな動物の位置を検出することができます。通常、この処理では、対象フィーチャの周辺にバウンディングボックスが描画されます。衛星画像、航空写真、またはドローン画像内の特定の特徴を特定し、それらの特徴をマップ上でプロットするために、GIS において使用できます。

セマンティックセグメンテーション

セマンティックセグメンテーションは、画像内の各ピクセルがクラスに属しているとして分類されるときに発生します。たとえば、左下の画像では、道路のピクセルが道路以外のピクセルとは別に分類されます。右では、写真内で猫を形成するピクセルが猫として分類され、画像内の他のピクセルが他のクラスに属しています。通常、GIS では、ピクセルの分類、セマンティックセグメンテーション、画像分類と呼ばれます。土地利用の分類マップを作成する際に使われます。

インスタンスセグメンテーション

インスタンスセグメンテーションは、各オブジェクトのインスタンスの境界が描画される、より正確なオブジェクト検出方法です。このタイプのディープラーニングアプリケーションは、オブジェクトセグメンテーションとも呼ばれます。