GeoAnalytics Desktop ツールは、Apache Spark を使用して、デスクトップ コンピューターでの解析に並列処理のフレームワークを提供します。集約、回帰、検出、クラスタリングを実行して、ビッグ データを視覚化、理解、および操作することができます。これらのツールはビッグ データセットを操作し、パターン、傾向、異常を通じてデータに対する洞察を得ることができます。このツールは、他のデスクトップ ジオプロセシング ツールと同様に、ArcGIS Pro で統合および実行されます。
GeoAnalytics Server ツールは、以下の状況で GeoAnalytics Desktop ツールより優れています。
- データがホスト フィーチャ レイヤーに格納されている。
- 解析の出力が ArcGIS Enterprise に配置される。
- 複数のコンピューターを使用して、解析が分散処理される。
- Linux、Web アプリ、またはサーバー コンピューターを使用して、解析が実行される。
- ファイルのコレクション (区切り文字で区切られたファイルやシェープファイルなど) またはビッグ データ ファイル共有のソース (クラウド ストア、HDFS、Hive など) が使用される。
GeoAnalytics Desktop ツールは大きなデータセット用に設計されています。したがって、小さなデータセットには、他のデスクトップ ツールを使用する方が適切な場合があります。GeoAnalytics Desktop ツールは、分散処理を実装するために最初の起動時間が必要であるため、大きなデータセット (数十万から数百万のレコード) に最適です。
GeoAnalytics Desktop ツールを使用する際には、いくつかの考慮すべき事項があります。Spark は、これらのツールを実行するときに、コンピューターのメモリと CPU コアを割り当てます。デフォルトでは、これはコンピューターのメモリの 95 パーセントとコンピューターのすべての CPU コアになります。解析は、これらのリソースが利用可能で別のサービスで使用されていない場合のみ開始されます。これらのリソースは、ツールの完了後、30 秒間保持されます。この 30 秒以内に同じ ArcGIS Pro プロジェクトで別の GeoAnalytics Desktop ツールを実行した場合、同じ予約済みリソースが使用されます。新しい ArcGIS Pro プロジェクトを開いて別のジョブを同時に実行しようとした場合も、同じリソースが使用されます。ジョブに割り当てられるリソースの量を変更するには、並列処理ファクター ジオプロセシング環境を変更します。これは、数値 (コア数) またはパーセンテージ (合計コア数のパーセンテージ) で指定できます。
ツールセット | 説明 |
---|---|
[パターンの分析] ツールセットには、フィーチャ データ内の空間パターンを識別、定量化、および視覚化するツールが含まれています。 | |
[データへの情報付加 (Data Enrichment)] ツールセットには、視覚化、回帰、予測向けの既存のフィーチャに属性を追加するためのツールが含まれています。 | |
このツールセットは、指定したさまざまな条件を満たす場所を特定するために使用されます。この条件は、属性検索 (所有者のいない土地区画など) と空間検索 (河川から 1 キロメートル以内など) に基づきます。検索するエリアを既存のフィーチャ (土地区画など) から選択したり、すべての要件を満たす新しいフィーチャを作成したりできます。 | |
[データの管理] ツールセットには、日々の地理データの管理に使用されるツールが含まれています。 | |
[データの集約] ツールセットには、エリア内または他のフィーチャの近くで、フィーチャとその属性の合計数、長さ、面積、および説明的な基本統計情報を計算するツールが用意されています。 | |
[近接] ツールセットには、「近くにあるのは何か」という空間解析の質問に答えるためのツールが含まれています。 | |
ユーティリティ ツールセットには、ビッグ データ コネクションの作成および変更をサポートするツールが含まれています。 |