ポイント クラスターの検索 (Find Point Clusters) (GeoAnalytics)

サマリー

時空間分布に基づき周辺ノイズ内でポイント フィーチャのクラスターを検索します。

[密度ベースのクラスター分析 (Density-based Clustering)] ツールの詳細

[密度ベースのクラスター分析 (Density-based Clustering)] ダイアグラム

使用法

  • このジオプロセシング ツールは ArcGIS Enterprise 10.6 1 以降で使用できます。

  • [ポイント クラスターの検索 (Find Point Clusters)] の入力は、ポイント レイヤーです。このツールは、[入力ポイント レイヤー] からクラスターを抽出し、周辺ノイズを特定します。

  • [ポイント クラスターの検索] では、[入力ポイント レイヤー] が投影されているか、出力座標系投影座標系に設定されている必要があります。

  • 2 つの [クラスター分析方法] パラメーター オプションがあります。[指定距離 (DBSCAN)] は、DBSCAN アルゴリズムを使用し、指定された検索距離に基づいて最近接にあるポイントのクラスターを検索します。[自己調整 (HDBSCAN)] は、HDBSCAN アルゴリズム (ArcGIS Enterprise 10.7 以降で利用可能) を使用して、DBSCAN と同様にポイントのクラスターを検索しますが、クラスターの可能性 (または安定性) に基づきさまざまな密度で、クラスターを考慮したさまざまな距離を使用します。[DBSCAN] を選択した場合、クラスターは 2 次元空間のみか、空間と時間の両方で検索できます。[時間を使ってクラスターを検索] をオンにし、入力レイヤーが時間対応かつ時間のタイプが瞬間である場合、DBSCAN は指定された検索距離および検索期間に基づいて最近接にあるポイントの時空間クラスターを検出します (ArcGIS Enterprise 10.8 以降でサポートされています)。

  • [クラスターあたりの最小フィーチャ数] パラメーターは、クラスター分析方法に応じて異なって使用されます。

    • [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから検索距離内にある必要があるフィーチャの数を指定します。結果は、この値よりも少ないフィーチャが含まれるクラスターを含むことができます。検索範囲の距離は、[検索距離] パラメーターを使用して設定されます。時間を使用してクラスターを検索する場合、[検索期間] が必要です。クラスター メンバーを検索する際、クラスターを形成するには、[検索距離] および [検索期間] 内に [クラスターあたりの最小フィーチャ数] が見つかる必要があります。この距離および期間は、検出されたポイント クラスターの直径または時間範囲には関連しません。
    • [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイントを含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスター サイズでもあります。

  • このツールは、各フィーチャが配置されるクラスターを特定する新しい整数フィールド CLUSTER_ID を持つ出力フィーチャクラスを生成します。デフォルトのレンダリングは COLOR_ID フィールドに基づきます。複数のクラスターに各色が割り当てられます。各色は、各クラスターが近傍のクラスターから視覚的に区別されるように割り当てられ、反復されます。

  • [指定距離 (DBSCAN)] クラスター分析手法を時間とともに使用し、時空間クラスターを検出する場合、結果には次のフィールドも含まれます。

    • FEAT_TIME - 各フィーチャの元となる瞬間の時間。
    • START_DATETIME - フィーチャが含まれるクラスターの時間範囲における開始時間。
    • END_DATETIME - フィーチャが含まれるクラスターの時間範囲における終了時間。

    生成されるレイヤーの時間プロパティは、START_DATETIME および END_DATETIME フィールドの間隔として設定され、時間スライダーで時空間クラスターを視覚化する際は、すべてのクラスター メンバーが一緒に描画されます。これらのフィールドは視覚化の目的でのみ使用されます。ノイズ フィーチャの場合、START_DATETIME および END_DATETIMEFEAT_TIME と等しくなります。

  • [クラスター分析方法][自動調整 (HDBSCAN)] の場合、出力フィーチャクラスには次のフィールドも含まれます。

    • PROB - フィーチャが、割り当てられたクラスターに存在する可能性。
    • OUTLIER - フィーチャが自身のクラスターの外れ値である可能性。値が高いほど、フィーチャが外れ値である可能性が高いことを示しています。
    • EXEMPLAR - 各クラスターの最も代表的なフィーチャです。これらのフィーチャは値が 1 であることで示されます。
    • STABILITY - さまざまな縮尺における各クラスターの持続性。値が大きいほど、より広範な距離縮尺においてクラスターが持続できることを示しています。

  • HDBSCAN アルゴリズムを、300 万個を超えるフィーチャを含んでいる入力レイヤーとともに使用する場合、管理者が GeoAnalyticsTools GP サービスjavaHeapSize パラメーターの値を増やさない限り、ツールが失敗することがあります。300 万個のフィーチャにつき、およそ 2 GB のヒープ領域が必要です。GeoAnalytics Server によって通常は必要とされる 16 GB に加えて、javaHeapSize で指定された量の RAM が各 GeoAnalytics Server コンピューター上で利用可能である必要があります。たとえば、HDBSCAN を使用して 900 万個のフィーチャをクラスタリングするには、javaHeapSize を 6144 MB または 6 GB 以上に設定します。その場合、各 GeoAnalytics Server コンピューターは、合計で少なくとも 22 GB の利用可能な RAM を備える必要があります。

  • 次の 1 つまたは複数のヒントを使用して、[ポイント クラスターの検索 (Find Point Clusters)] ツールのパフォーマンスを向上させることができます。

    • 対象データのみが解析されるように、範囲環境を設定します。
    • 検索距離および期間は注意して選択してください。検索距離または半径は小さい方が、同じデータに対して優れたパフォーマンスを発揮する場合があります。
    • 解析が実行されている場所に対してローカルなデータを使用します。

  • ジオプロセシング ツールは、ArcGIS GeoAnalytics Server を活用しています。解析は GeoAnalytics Server で実行され、結果が ArcGIS Enterprise のコンテンツに保存されます。

  • GeoAnalytics Server ツールを実行する場合、解析は GeoAnalytics Server で実行されます。最適なパフォーマンスを得るためには、ArcGIS Enterprise ポータルでホストされているフィーチャ レイヤーかビッグ データ ファイル共有を通じて、GeoAnalytics Server にデータを提供する必要があります。GeoAnalytics Server のローカルにないデータは、解析が開始する前に GeoAnalytics Server に移動されます。つまり、ツールを実行する時間が長くなり、場合によっては ArcGIS Pro から GeoAnalytics Server にデータを移動できないこともあります。エラーの閾値はネットワークの速度や、データのサイズや複雑さに左右されます。したがって、データを必ず共有するか、ビッグ データ ファイル共有を作成することをお勧めします。

    データをポータルで共有する方法の詳細

    ArcGIS Server Manager を使用してビッグ データ ファイル共有を作成する方法の詳細

パラメーター

ラベル説明データ タイプ
入力ポイント レイヤー

ポイント クラスターを含むポイント フィーチャクラス。

Feature Set
出力名

出力フィーチャ サービスの名前。

String
クラスターあたりの最小フィーチャ数

このパラメーターは以下のように、選択したクラスター分析手法に応じて異なる方法で使用されます。

  • [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから特定の距離内にある必要があるフィーチャの数を指定します。この距離は、[検索距離] パラメーターを使用して設定されます。
  • [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイントを含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスター サイズでもあります。

Long
検索範囲

考慮する最大距離。

指定される [クラスターあたりの最小フィーチャ数] はクラスター メンバーシップのこの距離内にある必要があります。個別のクラスターは最小のこの距離で分離されます。フィーチャがクラスター内で最近接するフィーチャからこの距離よりも離れて配置されている場合、クラスターには含められません。

Linear Unit
データ ストア
(オプション)

出力の保存先の ArcGIS Data Store を指定します。デフォルトは、[ビッグ データ ストア] です。ビッグ データ ストアに格納されたすべての結果は、WGS84 で保存されます。リレーショナル データ ストアに格納された結果は、それらの座標系を維持します。

  • ビッグ データ ストア出力がビッグ データ ストアに格納されます。これがデフォルトです。
  • リレーショナル データ ストア出力がリレーショナル データ ストアに格納されます。
String
クラスター分析方法
(オプション)

クラスターの定義に使用する方法を指定します。

  • 指定距離 (DBSCAN) 指定した距離を使用して、密度が低いノイズから密度の濃いクラスターを分離します。DBSCAN は最速のクラスター分析方法ですが、存在する可能性があるすべてのクラスターを定義するための明確な距離がある場合にのみ適しています。これにより、密度が同じクラスターが生成されます。これがデフォルトです。
  • 自己調整 (HDBSCAN) さまざまな距離を使用して、密度が低いノイズからさまざまな密度のクラスターを分離します。HDBSCAN は、最もデータを使用するクラスター分析手法で、最小のユーザー入力を必要とします。
String
時間を使用したクラスター検出
(オプション)

DBSCAN でのクラスターの検出に、時間を使用するかどうかを指定します。

  • オン - 検索距離と検索期間の両方を使用して、時空間クラスターが検索されます。
  • オフ - 空間クラスターは検索距離を使用して検索され、時間は無視されます。これがデフォルトです。
Boolean
検索期間
(オプション)

クラスター メンバーを検索する際、クラスターを形成するには、この期間内に指定された最小ポイント数が見つかる必要があります。

Time Unit

派生した出力

ラベル説明データ タイプ
出力フィーチャ レイヤー

出力ポイント クラスター。

フィーチャ セット

arcpy.geoanalytics.FindPointClusters(input_points, output_name, minimum_points, search_distance, {data_store}, {clustering_method}, {use_time}, {search_duration})
名前説明データ タイプ
input_points

ポイント クラスターを含むポイント フィーチャクラス。

Feature Set
output_name

出力フィーチャ サービスの名前。

String
minimum_points

このパラメーターは以下のように、選択したクラスター分析手法に応じて異なる方法で使用されます。

  • [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから特定の距離内にある必要があるフィーチャの数を指定します。この距離は、[検索距離] パラメーターを使用して設定されます。
  • [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイントを含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスター サイズでもあります。

Long
search_distance

考慮する最大距離。

指定される [クラスターあたりの最小フィーチャ数] はクラスター メンバーシップのこの距離内にある必要があります。個別のクラスターは最小のこの距離で分離されます。フィーチャがクラスター内で最近接するフィーチャからこの距離よりも離れて配置されている場合、クラスターには含められません。

Linear Unit
data_store
(オプション)

出力の保存先の ArcGIS Data Store を指定します。デフォルトは、SPATIOTEMPORAL_DATA_STORE です。ビッグ データ ストアに格納されたすべての結果は、WGS84 で保存されます。リレーショナル データ ストアに格納された結果は、それらの座標系を維持します。

  • SPATIOTEMPORAL_DATA_STORE出力がビッグ データ ストアに格納されます。これがデフォルトです。
  • RELATIONAL_DATA_STORE出力がリレーショナル データ ストアに格納されます。
String
clustering_method
(オプション)

クラスターの定義に使用する方法を指定します。

  • DBSCAN 指定した距離を使用して、密度が低いノイズから密度の濃いクラスターを分離します。DBSCAN は最速のクラスター分析方法ですが、存在する可能性があるすべてのクラスターを定義するための明確な距離がある場合にのみ適しています。これにより、密度が同じクラスターが生成されます。これがデフォルトです。
  • HDBSCAN さまざまな距離を使用して、密度が低いノイズからさまざまな密度のクラスターを分離します。HDBSCAN は、最もデータを使用するクラスター分析手法で、最小のユーザー入力を必要とします。
String
use_time
(オプション)

DBSCAN でのクラスターの検出に、時間を使用するかどうかを指定します。

  • TIME検索距離と検索期間の両方を使用して、時空間クラスターが検索されます。
  • NO_TIME空間クラスターは検索距離を使用して検索され、時間は無視されます。これがデフォルトです。
Boolean
search_duration
(オプション)

クラスター メンバーを検索する際、クラスターを形成するには、この期間内に指定された最小ポイント数が見つかる必要があります。

Time Unit

派生した出力

名前説明データ タイプ
output

出力ポイント クラスター。

フィーチャ セット

コードのサンプル

FindPointClusters (ポイント クラスターの検索) の例 (スタンドアロン スクリプト)

次の Python ウィンドウ スクリプトは、FindPointClustersツールの使用方法を示しています。

#-------------------------------------------------------------------------------
# Name: FindPointClusters.py
# Description: Finds Point Clusters of rodent infestations
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inputPoints = "https://myGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_countyData/BigDataCatalogServer/rat_sightings"
minimumPoints = 10
outputName = "RodentClusters"
searchDistance = "1 Kilometers"
dataStore = "SPATIOTEMPORAL_DATA_STORE"
clusterMethod = "DBSCAN"
# Execute Find Point Clusters
arcpy.geoanalytics.FindPointClusters(inputPoints, outputName, mimimumPoints, 
                                     searchDistance, dataStore, clusterMethod)

環境

特殊なケース

出力座標系

解析で使用される座標系。このパラメーターで指定されない限り、入力の座標系で解析が行われます。GeoAnalytics Tools の場合、最終結果は WGS84 のビッグ データ ストアに保存されます。

ライセンス情報

  • Basic: 次のものが必要 ArcGIS GeoAnalytics Server
  • Standard: 次のものが必要 ArcGIS GeoAnalytics Server
  • Advanced: 次のものが必要 ArcGIS GeoAnalytics Server

関連トピック