ポイントクラスターの検索 (Find Point Clusters) (GeoAnalytics)—ArcGIS Pro

サマリー

時空間分布に基づき周辺ノイズ内でポイントフィーチャのクラスターを検索します。

[密度ベースのクラスター分析 (Density-based Clustering)] ツールの詳細

図

[密度ベースのクラスター分析 (Density-based Clustering)] ダイアグラム

使用法

このジオプロセシングツールは ArcGIS Enterprise 10.6 1 以降で使用できます。
[ポイントクラスターの検索 (Find Point Clusters)] の入力は、ポイントレイヤーです。このツールは、[入力ポイントレイヤー] からクラスターを抽出し、周辺ノイズを特定します。
[ポイントクラスターの検索] では、[入力ポイントレイヤー] が投影されているか、出力座標系が投影座標系に設定されている必要があります。
2 つの [クラスター分析方法] パラメーターオプションがあります。[指定距離 (DBSCAN)] は、DBSCAN アルゴリズムを使用し、指定された検索距離に基づいて最近接にあるポイントのクラスターを検索します。[自己調整 (HDBSCAN)] は、HDBSCAN アルゴリズム (ArcGIS Enterprise 10.7 以降で利用可能) を使用して、DBSCAN と同様にポイントのクラスターを検索しますが、クラスターの可能性 (または安定性) に基づきさまざまな密度で、クラスターを考慮したさまざまな距離を使用します。[DBSCAN] を選択した場合、クラスターは 2 次元空間のみか、空間と時間の両方で検索できます。[時間を使ってクラスターを検索] をオンにし、入力レイヤーが時間対応かつ時間のタイプが瞬間である場合、DBSCAN は指定された検索距離および検索期間に基づいて最近接にあるポイントの時空間クラスターを検出します (ArcGIS Enterprise 10.8 以降でサポートされています)。
[クラスターあたりの最小フィーチャ数] パラメーターは、クラスター分析方法に応じて異なって使用されます。
- [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから検索距離内にある必要があるフィーチャの数を指定します。結果は、この値よりも少ないフィーチャが含まれるクラスターを含むことができます。検索範囲の距離は、[検索距離] パラメーターを使用して設定されます。時間を使用してクラスターを検索する場合、[検索期間] が必要です。クラスターメンバーを検索する際、クラスターを形成するには、[検索距離] および [検索期間] 内に [クラスターあたりの最小フィーチャ数] が見つかる必要があります。この距離および期間は、検出されたポイントクラスターの直径または時間範囲には関連しません。
- [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイントを含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスターサイズでもあります。
このツールは、各フィーチャが配置されるクラスターを特定する新しい整数フィールド CLUSTER_ID を持つ出力フィーチャクラスを生成します。デフォルトのレンダリングは COLOR_ID フィールドに基づきます。複数のクラスターに各色が割り当てられます。各色は、各クラスターが近傍のクラスターから視覚的に区別されるように割り当てられ、反復されます。
[指定距離 (DBSCAN)] クラスター分析手法を時間とともに使用し、時空間クラスターを検出する場合、結果には次のフィールドも含まれます。
- FEAT_TIME - 各フィーチャの元となる瞬間の時間。
- START_DATETIME - フィーチャが含まれるクラスターの時間範囲における開始時間。
- END_DATETIME - フィーチャが含まれるクラスターの時間範囲における終了時間。
生成されるレイヤーの時間プロパティは、START_DATETIME および END_DATETIME フィールドの間隔として設定され、時間スライダーで時空間クラスターを視覚化する際は、すべてのクラスターメンバーが一緒に描画されます。これらのフィールドは視覚化の目的でのみ使用されます。ノイズフィーチャの場合、START_DATETIME および END_DATETIME は FEAT_TIME と等しくなります。
[クラスター分析方法] が [自動調整 (HDBSCAN)] の場合、出力フィーチャクラスには次のフィールドも含まれます。
- PROB - フィーチャが、割り当てられたクラスターに存在する可能性。
- OUTLIER - フィーチャが自身のクラスターの外れ値である可能性。値が高いほど、フィーチャが外れ値である可能性が高いことを示しています。
- EXEMPLAR - 各クラスターの最も代表的なフィーチャです。これらのフィーチャは値が 1 であることで示されます。
- STABILITY - さまざまな縮尺における各クラスターの持続性。値が大きいほど、より広範な距離縮尺においてクラスターが持続できることを示しています。
HDBSCAN アルゴリズムを、300 万個を超えるフィーチャを含んでいる入力レイヤーとともに使用する場合、管理者が GeoAnalyticsTools GP サービスで javaHeapSize パラメーターの値を増やさない限り、ツールが失敗することがあります。300 万個のフィーチャにつき、およそ 2 GB のヒープ領域が必要です。GeoAnalytics Server によって通常は必要とされる 16 GB に加えて、javaHeapSize で指定された量の RAM が各 GeoAnalytics Server コンピューター上で利用可能である必要があります。たとえば、HDBSCAN を使用して 900 万個のフィーチャをクラスタリングするには、javaHeapSize を 6144 MB または 6 GB 以上に設定します。その場合、各 GeoAnalytics Server コンピューターは、合計で少なくとも 22 GB の利用可能な RAM を備える必要があります。
次の 1 つまたは複数のヒントを使用して、[ポイントクラスターの検索 (Find Point Clusters)] ツールのパフォーマンスを向上させることができます。
- 対象データのみが解析されるように、範囲環境を設定します。
- 検索距離および期間は注意して選択してください。検索距離または半径は小さい方が、同じデータに対して優れたパフォーマンスを発揮する場合があります。
- 解析が実行されている場所に対してローカルなデータを使用します。
ジオプロセシングツールは、ArcGIS GeoAnalytics Server を活用しています。解析は GeoAnalytics Server で実行され、結果が ArcGIS Enterprise のコンテンツに保存されます。
GeoAnalytics Server ツールを実行する場合、解析は GeoAnalytics Server で実行されます。最適なパフォーマンスを得るためには、ArcGIS Enterprise ポータルでホストされているフィーチャレイヤーかビッグデータファイル共有を通じて、GeoAnalytics Server にデータを提供する必要があります。GeoAnalytics Server のローカルにないデータは、解析が開始する前に GeoAnalytics Server に移動されます。つまり、ツールを実行する時間が長くなり、場合によっては ArcGIS Pro から GeoAnalytics Server にデータを移動できないこともあります。エラーの閾値はネットワークの速度や、データのサイズや複雑さに左右されます。したがって、データを必ず共有するか、ビッグデータファイル共有を作成することをお勧めします。
データをポータルで共有する方法の詳細
ArcGIS Server Manager を使用してビッグデータファイル共有を作成する方法の詳細

パラメーター

ラベル	説明	データタイプ
入力ポイントレイヤー	ポイントクラスターを含むポイントフィーチャクラス。	Feature Set
出力名	出力フィーチャサービスの名前。	String
クラスターあたりの最小フィーチャ数	このパラメーターは以下のように、選択したクラスター分析手法に応じて異なる方法で使用されます。 [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから特定の距離内にある必要があるフィーチャの数を指定します。この距離は、[検索距離] パラメーターを使用して設定されます。 [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイントを含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスターサイズでもあります。	Long
検索範囲	考慮する最大距離。指定される [クラスターあたりの最小フィーチャ数] はクラスターメンバーシップのこの距離内にある必要があります。個別のクラスターは最小のこの距離で分離されます。フィーチャがクラスター内で最近接するフィーチャからこの距離よりも離れて配置されている場合、クラスターには含められません。	Linear Unit
データストア (オプション)	出力の保存先の ArcGIS Data Store を指定します。デフォルトは、[ビッグデータストア] です。ビッグデータストアに格納されたすべての結果は、WGS84 で保存されます。リレーショナルデータストアに格納された結果は、それらの座標系を維持します。ビッグデータストア—出力がビッグデータストアに格納されます。これがデフォルトです。リレーショナルデータストア—出力がリレーショナルデータストアに格納されます。	String
クラスター分析方法 (オプション)	クラスターの定義に使用する方法を指定します。指定距離 (DBSCAN)— 指定した距離を使用して、密度が低いノイズから密度の濃いクラスターを分離します。DBSCAN は最速のクラスター分析方法ですが、存在する可能性があるすべてのクラスターを定義するための明確な距離がある場合にのみ適しています。これにより、密度が同じクラスターが生成されます。これがデフォルトです。自己調整 (HDBSCAN)— さまざまな距離を使用して、密度が低いノイズからさまざまな密度のクラスターを分離します。HDBSCAN は、最もデータを使用するクラスター分析手法で、最小のユーザー入力を必要とします。	String
時間を使用したクラスター検出 (オプション)	DBSCAN でのクラスターの検出に、時間を使用するかどうかを指定します。オン - 検索距離と検索期間の両方を使用して、時空間クラスターが検索されます。オフ - 空間クラスターは検索距離を使用して検索され、時間は無視されます。これがデフォルトです。	Boolean
検索期間 (オプション)	クラスターメンバーを検索する際、クラスターを形成するには、この期間内に指定された最小ポイント数が見つかる必要があります。	Time Unit

派生した出力

ラベル	説明	データタイプ
出力フィーチャレイヤー	出力ポイントクラスター。	フィーチャセット

arcpy.geoanalytics.FindPointClusters(input_points, output_name, minimum_points, search_distance, {data_store}, {clustering_method}, {use_time}, {search_duration})

名前	説明	データタイプ
input_points	ポイントクラスターを含むポイントフィーチャクラス。	Feature Set
output_name	出力フィーチャサービスの名前。	String
minimum_points	このパラメーターは以下のように、選択したクラスター分析手法に応じて異なる方法で使用されます。 [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから特定の距離内にある必要があるフィーチャの数を指定します。この距離は、[検索距離] パラメーターを使用して設定されます。 [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイントを含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスターサイズでもあります。	Long
search_distance	考慮する最大距離。指定される [クラスターあたりの最小フィーチャ数] はクラスターメンバーシップのこの距離内にある必要があります。個別のクラスターは最小のこの距離で分離されます。フィーチャがクラスター内で最近接するフィーチャからこの距離よりも離れて配置されている場合、クラスターには含められません。	Linear Unit
data_store (オプション)	出力の保存先の ArcGIS Data Store を指定します。デフォルトは、SPATIOTEMPORAL_DATA_STORE です。ビッグデータストアに格納されたすべての結果は、WGS84 で保存されます。リレーショナルデータストアに格納された結果は、それらの座標系を維持します。 SPATIOTEMPORAL_DATA_STORE—出力がビッグデータストアに格納されます。これがデフォルトです。 RELATIONAL_DATA_STORE—出力がリレーショナルデータストアに格納されます。	String
clustering_method (オプション)	クラスターの定義に使用する方法を指定します。 DBSCAN— 指定した距離を使用して、密度が低いノイズから密度の濃いクラスターを分離します。DBSCAN は最速のクラスター分析方法ですが、存在する可能性があるすべてのクラスターを定義するための明確な距離がある場合にのみ適しています。これにより、密度が同じクラスターが生成されます。これがデフォルトです。 HDBSCAN— さまざまな距離を使用して、密度が低いノイズからさまざまな密度のクラスターを分離します。HDBSCAN は、最もデータを使用するクラスター分析手法で、最小のユーザー入力を必要とします。	String
use_time (オプション)	DBSCAN でのクラスターの検出に、時間を使用するかどうかを指定します。 TIME—検索距離と検索期間の両方を使用して、時空間クラスターが検索されます。 NO_TIME—空間クラスターは検索距離を使用して検索され、時間は無視されます。これがデフォルトです。	Boolean
search_duration (オプション)	クラスターメンバーを検索する際、クラスターを形成するには、この期間内に指定された最小ポイント数が見つかる必要があります。	Time Unit

派生した出力

名前	説明	データタイプ
output	出力ポイントクラスター。	フィーチャセット

コードのサンプル

FindPointClusters (ポイントクラスターの検索) の例 (スタンドアロンスクリプト)

次の Python ウィンドウスクリプトは、FindPointClustersツールの使用方法を示しています。

#-------------------------------------------------------------------------------
# Name: FindPointClusters.py
# Description: Finds Point Clusters of rodent infestations
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inputPoints = "https://myGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_countyData/BigDataCatalogServer/rat_sightings"
minimumPoints = 10
outputName = "RodentClusters"
searchDistance = "1 Kilometers"
dataStore = "SPATIOTEMPORAL_DATA_STORE"
clusterMethod = "DBSCAN"
# Execute Find Point Clusters
arcpy.geoanalytics.FindPointClusters(inputPoints, outputName, mimimumPoints, 
                                     searchDistance, dataStore, clusterMethod)

環境

出力座標系, 範囲, 現在のワークスペース

特殊なケース

出力座標系: 解析で使用される座標系。このパラメーターで指定されない限り、入力の座標系で解析が行われます。GeoAnalytics Tools の場合、最終結果は WGS84 のビッグデータストアに保存されます。

ライセンス情報

Basic: 次のものが必要 ArcGIS GeoAnalytics Server
Standard: 次のものが必要 ArcGIS GeoAnalytics Server
Advanced: 次のものが必要 ArcGIS GeoAnalytics Server

サマリー

図

使用法

パラメーター

派生した出力

派生した出力

コードのサンプル

環境

特殊なケース

ライセンス情報

関連トピック

このトピックの内容