中心と分散の集計 (Summarize Center and Dispersion) (GeoAnalytics)

サマリー

中心フィーチャと分布指向性を検出し、入力から平均値と中央値の位置を計算します。

中心と分散の集計 (Summarize Center and Dispersion) ツールの図

使用法

  • このツールを使用すると、フィーチャの中心性と分散を把握できます。 以下の例は、このツールの使用が有益な状況を示したものです。

    • 地方自治体は、サービスが不十分な地域に新たに図書館を開く計画を立てています。 適切に区画された利用可能な土地からなるブロック グループから重心が集計されました。 人口のウェイトで中心フィーチャを計算することにより、地域に最善のサービスを提供する中心ブロック グループを特定できます。
    • GIS 解析は、緊急時電話 (911) の位置と緊急時対応局 (警察、消防、救急車) の位置を解析しています。 地理的中心の結果により、緊急時電話の地理的中心と緊急時対応局の地理的中心を比較し、応答時間を最適化できます。
    • 犯罪分析者は、空き巣の地理的中間地点が、日中のインシデントを評価するときと、夜間のインシデントを評価するときで、異なるかどうかを確認したいと考えています。 1 日の時間別のグループで地理的中間地点を計算することで、犯罪が日中と夜間にどこで発生しているかを特定できます。
    • 非政府組織の GIS アナリストは、感染症の拡大を分析しています。 楕円を使用すると、発生の分散をモデル化できます。

  • 入力ライン フィーチャとポリゴン フィーチャの場合は、距離の計算にフィーチャの重心が使用されます。

  • [加重フィールド] パラメーターを使用して、相対的重要性に応じ、位置にウェイトを付けます。 たとえば、小売りチェーンの店舗に総売上高で重み付けしたり、ポリゴン フィーチャに面積で重み付けしたりできます。 解析でのウェイトの適用方法については、「ウェイトの使用」をご参照ください。

  • [フィールドでグループ化] パラメーターを使用して、中心フィーチャまたは分散を個別に計算するためにフィーチャをグループ化します。 たとえば、年間を通して行われる野生生物の観測を季節または月別にグループ化できます。 フィールドは、整数型、日付型、または文字列型です。 NULL 値を含むレコードはグループ化されます。

  • 中心フィーチャは、データセット内の他のすべてのフィーチャに対する累積距離が最小となるフィーチャです。 このフィーチャは識別されると、[中心フィーチャ レイヤー] 出力に含まれます。 他のすべてのフィーチャに対する最短の累積距離を共有する複数のフィーチャが存在することがあります。 その場合、最も中心に位置するフィーチャが、すべて [中心フィーチャ レイヤー] 出力に含まれます。 [フィールドでグループ化] パラメーター値を指定した場合、フィールド値に基づいて、まず入力フィーチャがグループ化され、次にそのグループごとに中心フィーチャが識別されます。 出力中心フィーチャのジオメトリ タイプは、入力フィーチャと同じになります。

  • 地理的中心とは、X および Y 座標で構築されるポイントのことです。 地理的中心フィーチャは [地理的中心レイヤー] 出力に含まれます。 [フィールドでグループ化] 値を指定した場合、フィールド値に基づいて、まず入力フィーチャがグループ化され、次にそのグループごとに地理的中心が計算されます。

  • 地理的中間地点の算出では、反復アルゴリズムを使用して、データセット内のすべてのフィーチャに対するユークリッド距離が最小となる地理的な中間点を検出します。 地理的中間地点フィーチャは [地理的中間地点レイヤー] 出力に含まれます。 [フィールドでグループ化] 値を指定した場合、フィールド値に基づいて、まず入力フィーチャがグループ化され、次にそのグループごとに地理的中間地点が計算されます。 地理的中心の算出操作の結果とは異なり、地理的中間地点の算出結果は、外れ値フィーチャの影響をあまり受けません。

  • 標準偏差楕円を作成して、中心傾向、分散、指向性傾向といった、地理フィーチャの空間特性をまとめます。 楕円のサイズは、1、2、または 3 の標準偏差です。 楕円フィーチャは [楕円レイヤー] 出力に含まれます。 [フィールドでグループ化] 値を指定した場合、フィールド値に基づいて、まず入力フィーチャがグループ化され、次にそのグループごとに楕円が計算されます。

  • 1 つまたは複数の集計タイプを指定して出力できます。 各集計タイプは、一意のフィーチャ レイヤーに出力されます。

  • 時間またはジオメトリに NULL 値を含むフィーチャが入力レイヤーに存在する場合、そのフィーチャは解析に使用されません。

  • 出力の [中心フィーチャ] 集計タイプの結果には、入力レイヤー内のフィールドだけでなく、次のフィールドも含まれます。

    フィールド名説明

    CoordX

    中心フィーチャの X 座標。 フィーチャがラインまたはポリゴンの場合、値はフィーチャの重心を表します。

    CoordY

    中心フィーチャの Y 座標。 フィーチャがラインまたはポリゴンの場合、値はフィーチャの重心を表します。

    instant_datetime

    入力レイヤーが時間対応かつ時間タイプが「インスタント」の場合、出力結果には出力フィーチャの時間を表す instant date フィールドが含まれます。

    start_datetime

    入力レイヤーが時間対応かつ時間タイプが「間隔」の場合、出力結果には出力フィーチャの開始時間を表す start date フィールドが含まれます。

    end_datetime

    入力レイヤーが時間対応かつ時間タイプが「間隔」の場合、出力結果には出力フィーチャの終了時間を表す end date フィールドが含まれます。

  • [平均値中心] および [中央値中心] サマリー タイプの結果には、解析で使用されるオプションの [フィールドでグループ化] パラメーター値に加えて次のフィールドも含まれます。

    フィールド名説明

    CoordX

    中心または中間地点フィーチャの X 座標。

    CoordY

    中心または中間地点フィーチャの Y 座標。

    instant_datetime

    入力レイヤーが時間対応の場合、出力結果には入力フィーチャの時間の平均値または中央値を表す instant date フィールドが含まれます。 これは、時間タイプが間隔および即時の両方の入力レイヤーに該当します。

  • 出力の [楕円] サマリー タイプには、解析で使用されるオプションの [フィールドでグループ化] パラメーター値に加えて次のフィールドも含まれます。

    フィールド名説明

    CenterX

    楕円の地理的中心の X 座標。

    CenterY

    楕円の地理的中心の Y 座標。

    CenterT

    楕円の地理的中心の時間値。

    Rotation

    時計回りに正午の位置から計測される長軸の回転。 回転は、入力の空間参照の単位で計測されます。 たとえば、投影変換されたデータセットはメートル単位で計測され、地理データセットは度単位で計測されます。

    MajStdDist

    長軸の標準距離。 回転は、入力の空間参照の単位で計測されます。 たとえば、投影空間参照を含むデータセットはメートル単位で計測され、地理空間参照を含むデータセットは度単位で計測されます。

    MinStdDist

    短軸の標準距離。 回転は、入力の空間参照の単位で計測されます。 たとえば、投影空間参照を含むデータセットはメートル単位で計測され、地理空間参照を含むデータセットは度単位で計測されます。

    TmStdDist

    時間的標準距離。 この値はミリ秒単位の時間として計測されます。

  • CoordXCoordY などの座標値の属性は、解析の空間参照を使用して計算されます。 デフォルトでは、解析の空間参照は入力レイヤーと同じになります。 必要に応じて、出力座標系環境変数を使用して、解析で使用する空間参照を指定することができます。

    ビッグ データ ストアに結果を書き込む場合、結果のフィーチャは WGS 1984 (WKID 4326) 座標系で表されます。 このため、結果のフィーチャのジオメトリ値が、出力の属性値とは異なる座標系に格納されることがあります。 たとえば、地理的中心レイヤーをビッグ データ ストアに出力し、出力座標系環境の値を NAD 1983 UTM Zone 1N (WKID 26901) に指定した場合、CoordXCoordY フィールドの計算値の座標系は NAD 1983 UTM Zone 1N (WKID 26901) になりますが、マップ上のフィーチャの座標系は WGS 1984 (WKID 4326) になります。

  • 次の操作を 1 つ以上実行すると、[中心と分散の集計 (Summarize Center and Dispersion)] ツールのパフォーマンスを上げることができます。

    • 対象データのみが解析されるように、範囲環境を設定します。
    • 解析が実行されている場所に対してローカルなデータを使用します。
    • [フィールドでグループ化] パラメーターを使用してデータをグループ化します。
    • 大きなデータセットの場合、[生成タイプ][地理的中間地点] を使用しますが、このオプションでは反復的な計算が行われるため、集計タイプの中で最もパフォーマンスが低くなる可能性があります。

  • ジオプロセシング ツールは、ArcGIS GeoAnalytics Server を活用しています。解析は GeoAnalytics Server で実行され、結果が ArcGIS Enterprise のコンテンツに保存されます。

  • GeoAnalytics Server ツールを実行する場合、解析は GeoAnalytics Server で実行されます。最適なパフォーマンスを得るためには、ArcGIS Enterprise ポータルでホストされているフィーチャ レイヤーかビッグ データ ファイル共有を通じて、GeoAnalytics Server にデータを提供する必要があります。GeoAnalytics Server のローカルにないデータは、解析が開始する前に GeoAnalytics Server に移動されます。つまり、ツールを実行する時間が長くなり、場合によっては ArcGIS Pro から GeoAnalytics Server にデータを移動できないこともあります。エラーの閾値はネットワークの速度や、データのサイズや複雑さに左右されます。したがって、データを必ず共有するか、ビッグ データ ファイル共有を作成することをお勧めします。

    データをポータルで共有する方法の詳細

    ArcGIS Server Manager を使用してビッグ データ ファイル共有を作成する方法の詳細

パラメーター

ラベル説明データ タイプ
入力レイヤー

集計するポイント レイヤー、ライン レイヤー、またはポリゴン レイヤー。

Feature Set
出力名

出力フィーチャ サービスの名前。

String
生成タイプ

生成する集計タイプを指定します。 1 つ以上の集計タイプを使用できます。 選択した集計タイプごとに一意のレイヤーが作成されます。

  • 中心フィーチャ入力レイヤー内で最も中心のフィーチャのコピーを含むレイヤーが作成されます。
  • 地理的中心入力レイヤーの地理的中心を表すポイント レイヤーが作成されます。
  • 地理的中間地点入力レイヤーの地理的中間地点を表すポイント レイヤーが作成されます。
  • 楕円形入力レイヤーの指向性楕円を表すポリゴン レイヤーが作成されます。
String
楕円サイズ
(オプション)

標準偏差における出力楕円のサイズを指定します。

  • 1 つの標準偏差出力楕円は入力フィーチャの 1 標準偏差をカバーします。 これがデフォルトです。
  • 2 標準偏差出力楕円は入力フィーチャの 2 標準偏差をカバーします。
  • 3 標準偏差出力楕円は入力フィーチャの 3 標準偏差をカバーします。
String
加重フィールド
(オプション)

相対的重要性に応じて位置にウェイトを付けるために使用される数値フィールドです。 これはすべての集計タイプに適用されます。

Field
フィールドでグループ化
(オプション)

類似するフィーチャをグループ化するために使用されるフィールド。 これはすべての集計タイプに適用されます。 たとえば、樹木、灌木、草原の値を含む PlantType という名前のフィールドを選択した場合、値が樹木であるすべてのフィーチャに対して中心または分散が解析されます。 この例では、樹木、灌木、草原の各グループで 1 つずつ、計 3 つのフィーチャが出力されます。

Field
データ ストア
(オプション)

出力の保存先の ArcGIS Data Store を指定します。デフォルトは、[ビッグ データ ストア] です。ビッグ データ ストアに格納されたすべての結果は、WGS84 で保存されます。リレーショナル データ ストアに格納された結果は、それらの座標系を維持します。

  • ビッグ データ ストア出力がビッグ データ ストアに格納されます。これがデフォルトです。
  • リレーショナル データ ストア出力がリレーショナル データ ストアに格納されます。
String

派生した出力

ラベル説明データ タイプ
中心フィーチャ レイヤー

入力レイヤーの中心フィーチャを含むレイヤー。

Feature Class
地理的中心レイヤー

入力レイヤーの地理的中心のリプレゼンテーションを含むポイント レイヤー。

Feature Class
地理的中間地点レイヤー

入力レイヤーの地理的中間地点のリプレゼンテーションを含むポイント レイヤー。

Feature Class
楕円レイヤー

入力レイヤーの楕円のリプレゼンテーションを含むポリゴン レイヤー。

Feature Class

arcpy.geoanalytics.SummarizeCenterAndDispersion(input_layer, output_name, generate_types, {ellipse_size}, {weight_field}, {group_by_field}, {data_store})
名前説明データ タイプ
input_layer

集計するポイント レイヤー、ライン レイヤー、またはポリゴン レイヤー。

Feature Set
output_name

出力フィーチャ サービスの名前。

String
generate_types
[generate_types,...]

生成する集計タイプを指定します。 1 つ以上の集計タイプを使用できます。 選択した集計タイプごとに一意のレイヤーが作成されます。

  • CENTRAL_FEATURE入力レイヤー内で最も中心のフィーチャのコピーを含むレイヤーが作成されます。
  • MEAN_CENTER入力レイヤーの地理的中心を表すポイント レイヤーが作成されます。
  • MEDIAN_CENTER入力レイヤーの地理的中間地点を表すポイント レイヤーが作成されます。
  • ELLIPSE入力レイヤーの指向性楕円を表すポリゴン レイヤーが作成されます。
String
ellipse_size
(オプション)

標準偏差における出力楕円のサイズを指定します。

  • 1_STANDARD_DEVIATION出力楕円は入力フィーチャの 1 標準偏差をカバーします。 これがデフォルトです。
  • 2_STANDARD_DEVIATIONS出力楕円は入力フィーチャの 2 標準偏差をカバーします。
  • 3_STANDARD_DEVIATIONS出力楕円は入力フィーチャの 3 標準偏差をカバーします。
String
weight_field
(オプション)

相対的重要性に応じて位置にウェイトを付けるために使用される数値フィールドです。 これはすべての集計タイプに適用されます。

Field
group_by_field
(オプション)

類似するフィーチャをグループ化するために使用されるフィールド。 これはすべての集計タイプに適用されます。 たとえば、樹木、灌木、草原の値を含む PlantType という名前のフィールドを選択した場合、値が樹木であるすべてのフィーチャに対して中心または分散が解析されます。 この例では、樹木、灌木、草原の各グループで 1 つずつ、計 3 つのフィーチャが出力されます。

Field
data_store
(オプション)

出力の保存先の ArcGIS Data Store を指定します。デフォルトは、SPATIOTEMPORAL_DATA_STORE です。ビッグ データ ストアに格納されたすべての結果は、WGS84 で保存されます。リレーショナル データ ストアに格納された結果は、それらの座標系を維持します。

  • SPATIOTEMPORAL_DATA_STORE出力がビッグ データ ストアに格納されます。これがデフォルトです。
  • RELATIONAL_DATA_STORE出力がリレーショナル データ ストアに格納されます。
String

派生した出力

名前説明データ タイプ
out_central_feature_layer

入力レイヤーの中心フィーチャを含むレイヤー。

Feature Class
out_mean_center_layer

入力レイヤーの地理的中心のリプレゼンテーションを含むポイント レイヤー。

Feature Class
out_median_center_layer

入力レイヤーの地理的中間地点のリプレゼンテーションを含むポイント レイヤー。

Feature Class
out_ellipse_layer

入力レイヤーの楕円のリプレゼンテーションを含むポリゴン レイヤー。

Feature Class

コードのサンプル

SummarizeCenterAndDispersion (中心と分散の集計) (スタンドアロンのスクリプト)

次のスタンドアロン スクリプトで、SummarizeCenterAndDispersion 関数を使用する方法を示します。

# Name: SummarizeCenterAndDispersion.py
# Description: Calculate a standard deviational ellipse of contagious disease 
#              data to understand the spread of the disease over time. 
#
# Requirements: ArcGIS GeoAnalytics Server

# Import system modules
import arcpy

# Set local variables
# This example calculates a standard deviational ellipse for three standard 
# deviations of the data
inFeatures = "https://sampleserver6.com/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_myBDFS/BigDataCatalogServer/diseaseRecords"
outFS = "disease_movement_ellipse"
summaryType = "ELLIPSE"
dataStore = "RELATIONAL_DATA_STORE"

# Execute SummarizeCenterAndDispersion
arcpy.geoanalytics.SummarizeCenterAndDispersion(inFeatures, outFS, summaryType, 
                                                "3_STANDARD_DEVIATIONS", "", 
                                                "", "", "", "" dataStore)

環境

特殊なケース

出力座標系

解析で使用される座標系。このパラメーターで指定されない限り、入力の座標系で解析が行われます。GeoAnalytics Tools の場合、最終結果は WGS84 のビッグ データ ストアに保存されます。

ライセンス情報

  • Basic: 次のものが必要 ArcGIS GeoAnalytics Server
  • Standard: 次のものが必要 ArcGIS GeoAnalytics Server
  • Advanced: 次のものが必要 ArcGIS GeoAnalytics Server

関連トピック