図
使用法
このジオプロセシング ツールは ArcGIS Enterprise 10.6 1 以降で使用できます。
[ポイント クラスターの検索 (Find Point Clusters)] の入力は、ポイント レイヤーです。このツールは、[入力ポイント レイヤー] からクラスターを抽出し、周辺ノイズを特定します。
[ポイント クラスターの検索] では、[入力ポイント レイヤー] が投影されているか、出力座標系が投影座標系に設定されている必要があります。
2 つの [クラスター分析方法] パラメーター オプションがあります。[指定距離 (DBSCAN)] は、DBSCAN アルゴリズムを使用し、指定された検索距離に基づいて最近接にあるポイントのクラスターを検索します。[自己調整 (HDBSCAN)] は、HDBSCAN アルゴリズム (ArcGIS Enterprise 10.7 以降で利用可能) を使用して、DBSCAN と同様にポイントのクラスターを検索しますが、クラスターの可能性 (または安定性) に基づきさまざまな密度で、クラスターを考慮したさまざまな距離を使用します。[DBSCAN] を選択した場合、クラスターは 2 次元空間のみか、空間と時間の両方で検索できます。[時間を使ってクラスターを検索] をオンにし、入力レイヤーが時間対応かつ時間のタイプが瞬間である場合、DBSCAN は指定された検索距離および検索期間に基づいて最近接にあるポイントの時空間クラスターを検出します (ArcGIS Enterprise 10.8 以降でサポートされています)。
[クラスターあたりの最小フィーチャ数] パラメーターは、クラスター分析方法に応じて異なって使用されます。
- [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから検索距離内にある必要があるフィーチャの数を指定します。結果は、この値よりも少ないフィーチャが含まれるクラスターを含むことができます。検索範囲の距離は、[検索距離] パラメーターを使用して設定されます。時間を使用してクラスターを検索する場合、[検索期間] が必要です。クラスター メンバーを検索する際、クラスターを形成するには、[検索距離] および [検索期間] 内に [クラスターあたりの最小フィーチャ数] が見つかる必要があります。この距離および期間は、検出されたポイント クラスターの直径または時間範囲には関連しません。
- [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイントを含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスター サイズでもあります。
このツールは、各フィーチャが配置されるクラスターを特定する新しい整数フィールド CLUSTER_ID を持つ出力フィーチャクラスを生成します。デフォルトのレンダリングは COLOR_ID フィールドに基づきます。複数のクラスターに各色が割り当てられます。各色は、各クラスターが近傍のクラスターから視覚的に区別されるように割り当てられ、反復されます。
[指定距離 (DBSCAN)] クラスター分析手法を時間とともに使用し、時空間クラスターを検出する場合、結果には次のフィールドも含まれます。
- FEAT_TIME - 各フィーチャの元となる瞬間の時間。
- START_DATETIME - フィーチャが含まれるクラスターの時間範囲における開始時間。
- END_DATETIME - フィーチャが含まれるクラスターの時間範囲における終了時間。
生成されるレイヤーの時間プロパティは、START_DATETIME および END_DATETIME フィールドの間隔として設定され、時間スライダーで時空間クラスターを視覚化する際は、すべてのクラスター メンバーが一緒に描画されます。これらのフィールドは視覚化の目的でのみ使用されます。ノイズ フィーチャの場合、START_DATETIME および END_DATETIME は FEAT_TIME と等しくなります。
[クラスター分析方法] が [自動調整 (HDBSCAN)] の場合、出力フィーチャクラスには次のフィールドも含まれます。
- PROB - フィーチャが、割り当てられたクラスターに存在する可能性。
- OUTLIER - フィーチャが自身のクラスターの外れ値である可能性。値が高いほど、フィーチャが外れ値である可能性が高いことを示しています。
- EXEMPLAR - 各クラスターの最も代表的なフィーチャです。これらのフィーチャは値が 1 であることで示されます。
- STABILITY - さまざまな縮尺における各クラスターの持続性。値が大きいほど、より広範な距離縮尺においてクラスターが持続できることを示しています。
HDBSCAN アルゴリズムを、300 万個を超えるフィーチャを含んでいる入力レイヤーとともに使用する場合、管理者が GeoAnalyticsTools GP サービスで javaHeapSize パラメーターの値を増やさない限り、ツールが失敗することがあります。300 万個のフィーチャにつき、およそ 2 GB のヒープ領域が必要です。GeoAnalytics Server によって通常は必要とされる 16 GB に加えて、javaHeapSize で指定された量の RAM が各 GeoAnalytics Server コンピューター上で利用可能である必要があります。たとえば、HDBSCAN を使用して 900 万個のフィーチャをクラスタリングするには、javaHeapSize を 6144 MB または 6 GB 以上に設定します。その場合、各 GeoAnalytics Server コンピューターは、合計で少なくとも 22 GB の利用可能な RAM を備える必要があります。
次の 1 つまたは複数のヒントを使用して、[ポイント クラスターの検索 (Find Point Clusters)] ツールのパフォーマンスを向上させることができます。
- 対象データのみが解析されるように、範囲環境を設定します。
- 検索距離および期間は注意して選択してください。検索距離または半径は小さい方が、同じデータに対して優れたパフォーマンスを発揮する場合があります。
- 解析が実行されている場所に対してローカルなデータを使用します。
ジオプロセシング ツールは、ArcGIS GeoAnalytics Server を活用しています。解析は GeoAnalytics Server で実行され、結果が ArcGIS Enterprise のコンテンツに保存されます。
GeoAnalytics Server ツールを実行する場合、解析は GeoAnalytics Server で実行されます。最適なパフォーマンスを得るためには、ArcGIS Enterprise ポータルでホストされているフィーチャ レイヤーかビッグ データ ファイル共有を通じて、GeoAnalytics Server にデータを提供する必要があります。GeoAnalytics Server のローカルにないデータは、解析が開始する前に GeoAnalytics Server に移動されます。つまり、ツールを実行する時間が長くなり、場合によっては ArcGIS Pro から GeoAnalytics Server にデータを移動できないこともあります。エラーの閾値はネットワークの速度や、データのサイズや複雑さに左右されます。したがって、データを必ず共有するか、ビッグ データ ファイル共有を作成することをお勧めします。
構文
arcpy.geoanalytics.FindPointClusters(input_points, output_name, minimum_points, search_distance, {data_store}, {clustering_method}, {use_time}, {search_duration})
パラメーター | 説明 | データ タイプ |
input_points | ポイント クラスターを含むポイント フィーチャクラス。 | Feature Set |
output_name | 出力フィーチャ サービスの名前。 | String |
minimum_points | このパラメーターは以下のように、選択したクラスター分析手法に応じて異なる方法で使用されます。
| Long |
search_distance | 考慮する最大距離。 指定される [クラスターあたりの最小フィーチャ数] はクラスター メンバーシップのこの距離内にある必要があります。個別のクラスターは最小のこの距離で分離されます。フィーチャがクラスター内で最近接するフィーチャからこの距離よりも離れて配置されている場合、クラスターには含められません。 | Linear Unit |
data_store (オプション) | 出力の保存先の ArcGIS Data Store を指定します。デフォルトは、SPATIOTEMPORAL_DATA_STORE です。ビッグ データ ストアに格納されたすべての結果は、WGS84 で保存されます。リレーショナル データ ストアに格納された結果は、それらの座標系を維持します。
| String |
clustering_method (オプション) | クラスターの定義に使用する方法を指定します。
| String |
use_time (オプション) | DBSCAN でのクラスターの検出に、時間を使用するかどうかを指定します。
| Boolean |
search_duration (オプション) | クラスター メンバーを検索する際、クラスターを形成するには、この期間内に指定された最小ポイント数が見つかる必要があります。 | Time Unit |
派生した出力
名前 | 説明 | データ タイプ |
output | 出力ポイント クラスター。 | フィーチャ セット |
コードのサンプル
次の Python ウィンドウ スクリプトは、FindPointClustersツールの使用方法を示しています。
#-------------------------------------------------------------------------------
# Name: FindPointClusters.py
# Description: Finds Point Clusters of rodent infestations
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inputPoints = "https://myGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_countyData/BigDataCatalogServer/rat_sightings"
minimumPoints = 10
outputName = "RodentClusters"
searchDistance = "1 Kilometers"
dataStore = "SPATIOTEMPORAL_DATA_STORE"
clusterMethod = "DBSCAN"
# Execute Find Point Clusters
arcpy.geoanalytics.FindPointClusters(inputPoints, outputName, mimimumPoints,
searchDistance, dataStore, clusterMethod)
環境
- 出力座標系
解析で使用される座標系。このパラメーターで指定されない限り、入力の座標系で解析が行われます。GeoAnalytics Tools の場合、最終結果は WGS84 のビッグ データ ストアに保存されます。
ライセンス情報
- Basic: 次のものが必要 ArcGIS GeoAnalytics Server
- Standard: 次のものが必要 ArcGIS GeoAnalytics Server
- Advanced: 次のものが必要 ArcGIS GeoAnalytics Server