GeoAnalytics Desktop ツールは、Apache Spark を使用して、デスクトップ コンピューターでの解析に並列処理のフレームワークを提供します。集約、回帰、検出、クラスタリングを実行して、ビッグ データを視覚化、理解、および操作することができます。これらのツールはビッグ データセットを操作し、パターン、傾向、異常を通じてデータに対する洞察を得ることができます。このツールは、他のデスクトップ ジオプロセシング ツールと同様に、ArcGIS Pro で統合および実行されます。
GeoAnalytics Desktop ツールは大きなデータセット用に設計されています。したがって、小さなデータセットには、他のデスクトップ ツールを使用する方が適切な場合があります。GeoAnalytics Desktop ツールは、分散処理を実装するために最初の起動時間が必要であるため、大きなデータセット (数十万から数百万のレコード) に最適です。
ArcGIS Pro の他のツールと同様に、GeoAnalytics Desktop ツールのパフォーマンスは以下に左右されます。
- 入力データのサイズ - フィーチャの数やフィールド数など。
- 入力データ ソース - たとえば、シェープファイルと比較した場合のファイル ジオデータベース フィーチャクラス。
- 実行しているツール - たとえば、[ポイントの集約 (Aggregate Points)] は、同じデータとビン サイズで [密度の計算 (Calculate Density)] を実行したときより短時間で完了します。
- ツールで使用するパラメーター - たとえば、[フィーチャの結合 (Join Features)] ツールを使用する場合、結合距離が小さい方が大きい場合よりパフォーマンスが高くなります。
- ArcGIS Pro コンピューターのハードウェア。
以下の「データ」セクションでは、データ ソースの注意事項について説明します。それぞれの GeoAnalytics Desktop ツールのトピックには、パラメーターの変更によるツールのパフォーマンスの向上について、使用上の注意が記載されています。
データ
解析を実行するとき、同じ場所にあるデータは最高のパフォーマンスを発揮します。
GeoAnalytics Desktop ツールは、入力と出力に次のデータ ソースをサポートしています。
- シェープファイル
- ファイル ジオデータベース
- テーブル (*.csv ファイルなど)
GeoAnalytics Desktop ツールの読み書きでは、入力と出力にシェープファイルを使用する方が、ファイル ジオデータベースを使用する場合より高速になる場合があります。ただし、ファイル ジオデータベースの方がシェープファイルより解析上の利点があるため、データ ソースは慎重に検討する必要があります。
GeoAnalytics Desktop ツールは、入力と出力に次のデータ ソースをサポートしていません。
- GeoPackage
- XY イベント レイヤー
- サービス (マップやフィーチャ サービスなど)
解析
GeoAnalytics Desktop ツールは、他の ArcGIS Pro ツールとは同じようには動作しない場合があります。
GeoAnalytics では、処理にポリゴン スリバーは含まれません。[フィーチャの結合 (Join Features)] と [オーバーレイ レイヤー (Overlay Layers)] GeoAnalytics ツールでは、スリバーは解析に含まれません。
GeoAnalytics Desktop ツールの結果は、他の ArcGIS Pro ツールよりフィーチャに頂点が挿入されません。たとえば、次の図は、[解析] ツールボックスの [バッファー (Buffer)] を使用した場合 (青色) と [GeoAnalytics Desktop] ツールボックスの [バッファーの作成 (Create Buffers)] を使用した場合 (オレンジ色) のバッファー ポリゴンの頂点の結果を示しています。左の図は、互いにオーバーレイされたバッファー ポリゴンを示しています。右の図は、ポリゴンの頂点の一部を拡大表示しています。
GeoAnalytics Desktop ツールは in_memory ワークスペースをサポートしていません。
GeoAnalytics Desktop ツールを実行するとき、解析はメモリで行われます。解析されるデータがメモリに収まらない場合、データはディスクの一時ディレクトリに書き込まれます。ツールが完了せず、一時ドライブの領域を占有している場合、Windows の一時ドライブをより大きなディスクに変更できます。
ベスト プラクティス
解析を実行するときは、対象のデータのみを解析することをお勧めします。解析するデータは、次のようにして制限できます。
- マップのレイヤーにフィルター設定を適用します。
- マップ上のフィーチャに選択を適用します。
- 解析の処理対象範囲を設定して、使用されるフィーチャの空間範囲を制限します。
- タイム スライダーを使用して、解析するデータの範囲を指定します。
GeoAnalytics Desktop ツールを使用する場合、一般的にフィルター設定の方が選択セットより処理が高速です。
解析での時間の使用
多くの GeoAnalytics Desktop ツールは、時間を使用するか、時間が必要です。時間ステップ、時系列結合、またはトラックベースの解析を利用するには、(たとえば、[トラックの再構築 (Reconstruct Tracks)]、[滞在場所の検索 (Find Dwell Locations)]、[インシデントの検出 (Detect Incidents)] を使用)、レイヤーが時間に対応している必要があります。レイヤーを時間対応にするには、ArcGIS Pro でレイヤーをマップに追加して、データの時間プロパティを設定します。時間を設定するときは、[時間の形式] と [時間範囲] パラメーターがデータと一致していることを確認します。値が正しくないようならば、次のいずれかを実行して、時間フィールドの形式を修正します。
- [時間フィールドの変換 (Convert Time Field)] ツールを使用して、時間フィールドをサポートされている形式に修正します。
- 時間フィールドが複数のフィールドに分かれている場合、時間フィールドを修正します。
解析を実行するときは、レイヤーをツールに追加する前に時間を有効化する必要があります。レイヤーをツールのパラメーターに追加した後に時間を設定した場合は、レイヤーをもう一度追加する必要があります。レイヤーを追加する前に時間が有効化されていない場合、レイヤーで時間が有効化されていないことを示す警告が表示されます。
他のジオプロセシング ツールと同様に、表示されている時間範囲内のフィーチャのみが解析されます。
ArcPy を使用してレイヤーの時系列解析を実行したり、時間設定を共有したりするには、時間設定したレイヤー ファイルを作成して、そのレイヤーを解析に使用します。