属性の集計 (Summarize Attributes) (GeoAnalytics)

概要

フィーチャクラス内のフィールドの要約統計量を計算します。

使用法

  • [属性の集計 (Summarize Attributes)] は空間解析ツールではなく、表形式の解析ツールです。表形式のレイヤーか、ジオメトリを持つレイヤー (ポイント、ライン、ポリゴン) を入力として使用できます。

  • 1 つ以上のフィールドを指定して集計するか、すべてのフィーチャを集計できます。フィールドで集計する場合、統計情報は、属性値の一意の組み合わせごとに計算されます。

  • [出力テーブル] は、統計演算の結果を含むフィールドで構成されます。

  • 次の命名規則を使用して、指定した各統計情報タイプのフィールドが作成されます。sum_<field>max_<field>min_<field>range_<field>std_<field>count_<field>var_<field>、および any_<field> (ここで、<field> は、統計情報が計算される入力フィールドの名前です)。統計情報は、各グループで個別に計算されます。

  • 入力で時間が有効化されている場合、時間ステップを解析に適用できます。各時間ステップは、時間ステップ外のフィーチャとは切り離して解析されます。時間ステップを使用するには、入力データを時間対応にし、任意の時点を時間で表す必要があります。時間ステップを適用すると、出力フィーチャは START_DATETIME および END_DATETIME フィールドで表した時間間隔になります。

    時間ステップの詳細

  • このツールを空間データに適用すると、表形式の結果を得ることができます。[フィーチャの結合] を使用し、空間データに結果を結合することができます。

  • 次のテーブルでは、類似したフィールド値を使用して集計されたレイヤーの統計計算を示します。レイヤーの数値統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差]、および [分散]) の計算には、[VO2] フィールドを使用しています。レイヤーの文字列統計情報 ([個数][すべて]) の計算には、[Rating] フィールドを使用しています。

    集計する入力レイヤー
    集計される入力レイヤーを示します。

    上記のテーブルは [Designation] フィールドで集計されており、レイヤーの数値統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差][分散]) の計算には、[VO2] フィールドを使用しています。レイヤーの文字列統計情報 ([個数][すべて]) の計算には、[Rating] フィールドを使用しています。これにより、異なる [Designation] 値を表す、2 つのフィーチャを持つテーブルが生成されます。

    [Designation] フィールドを使用して集計された入力レイヤー
    [Designation] フィールドを使用して集計された入力レイヤーを示します。

    次のテーブルでは、[Designation] フィールドと [Age Group] フィールドを使用してレイヤーを集計したときの、最初のいくつかのフィールドを示します。統計は、前の例と同じ方法で計算されます。

    [Designation] フィールドと [Age Group] フィールドを使用して集計された入力レイヤー
    [Designation] フィールドと [Age Group] フィールドを使用して集計された入力レイヤーを示します。
  • 次のヒントを使用することで、[属性の集計 (Summarize Attributes)] ツールのパフォーマンスを向上させることができます。

    • 対象データのみを解析するように、範囲環境を設定します。
    • 解析が実行されている場所に対してローカルなデータを使用します。

  • ジオプロセシング ツールは、ArcGIS GeoAnalytics Server を活用しています。解析は GeoAnalytics Server で実行され、結果が ArcGIS Enterprise のコンテンツに保存されます。

  • GeoAnalytics Server ツールを実行する場合、解析は GeoAnalytics Server で実行されます。最適なパフォーマンスを得るためには、ArcGIS Enterprise ポータルでホストされているフィーチャ レイヤーかビッグ データ ファイル共有を通じて、GeoAnalytics Server にデータを提供する必要があります。GeoAnalytics Server のローカルにないデータは、解析が開始する前に GeoAnalytics Server に移動されます。つまり、ツールを実行する時間が長くなり、場合によっては ArcGIS Pro から GeoAnalytics Server にデータを移動できないこともあります。エラーの閾値はネットワークの速度や、データのサイズや複雑さに左右されます。したがって、データを必ず共有するか、ビッグ データ ファイル共有を作成することをお勧めします。

    データをポータルで共有する方法の詳細

    ArcGIS Server Manager を使用してビッグ データ ファイル共有を作成する方法の詳細

  • [解析] ツールボックスの [要約統計量 (Summary Statistics)] ツールを使用して、同様の解析を実行することもできます。

構文

arcpy.geoanalytics.SummarizeAttributes(input_layer, output_name, fields, {summary_fields}, {data_store}, {time_step_interval}, {time_step_repeat}, {time_step_reference})
パラメーター説明データ タイプ
input_layer

集計するポイント レイヤー、ポリライン レイヤー、またはポリゴン レイヤー。

Record Set
output_name

出力フィーチャ サービスの名前。

String
fields
[fields,...]

同様なフィーチャの集計に使用する 1 つまたは複数のフィールド。たとえば、商業地と住宅地の値を含む PropertyType フィールドを選択すると、住宅地の値を持つすべてのフィールドが集計されて統計情報のサマリーが算出され、商業地の値を持つすべてのフィールドが集計されます。この例では、商業地と住宅地のサマリー値の 2 行が出力に作成されます。

Field
summary_fields
[summary_fields,...]
(オプション)

指定されたフィールドに関して計算される統計情報。

  • COUNT - NULL 値でない値の数。数値フィールドまたは文字列に使用できます。[null, 0, 2] の個数は 2 です。
  • SUM - フィールド内の数値の合計。[null, null, 3] の合計は 3 です。
  • MEAN - 数値の平均。[0,2, null] の平均は 1 です。
  • MIN - 数値フィールドの最小値。[0, 2, null] の最小値は 0 です。
  • MAX - 数値フィールドの最大値。[0, 2, null] の最大値は 2 です。
  • STDDEV - 数値フィールドの標準偏差。[1] の標準偏差は null です。[null, 1,1,1] の標準偏差は null です。
  • VAR - トラッキング内の数値フィールドの分散。[1] の分散は null です。[null, 1,1,1] の分散は null です。
  • RANGE - 数値フィールドの範囲。これは、最大値から最小値を減算して計算されます。[0, null, 1] の範囲は 1 です。[null, 4] の範囲は 0 です。
  • ANY - 文字列型のフィールドのサンプル文字列。

Value Table
data_store
(オプション)

出力の保存先の ArcGIS Data Store を指定します。デフォルトは、SPATIOTEMPORAL_DATA_STORE です。ビッグ データ ストアに格納されたすべての結果は、WGS84 で保存されます。リレーショナル データ ストアに格納された結果は、それらの座標系を維持します。

  • SPATIOTEMPORAL_DATA_STORE出力がビッグ データ ストアに格納されます。これがデフォルトです。
  • RELATIONAL_DATA_STORE出力がリレーショナル データ ストアに格納されます。
String
time_step_interval
(オプション)

時間ステップの期間を指定する値。このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

時間ステップは、入力が時間対応である場合にのみ適用できます。

Time Unit
time_step_repeat
(オプション)

時間ステップの間隔が発生する頻度を指定する値。このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

Time Unit
time_step_reference
(オプション)

時間ステップを揃える基準時間を指定する日付。デフォルト値は、1970 年 1 月 1 日 12:00 a.m. です。このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

Date

派生した出力

名前説明データ タイプ
output

集計された属性を含む出力テーブル。

レコード セット

コードのサンプル

SummarizeAttributes (属性の集計) (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、SummarizeAttributesツールの使用方法を示しています。

#-------------------------------------------------------------------------------
# Name: Summarize Attributes.py
# Description: Summarize Crime Data by year and beat.
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
# This example used a big data file share name "Crimes" with dataset "Chicago" registered on my GeoAnalytics server
inFeatures = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Crimes/BigDataCatalogServer/Chicago"
summaryFields = ["Year", "Beat"]
summaryStatistics = [["Arrest", "COUNT"], ["District", "COUNT"]]
outFS = 'SummarizeCrimes'
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute SummarizeAttributes
arcpy.geoanalytics.SummarizeAttributes(inFeatures, outFS, summaryFields, 
                                       summaryStatistics, dataStore)

環境

出力座標系

解析で使用される座標系。このパラメーターで指定されない限り、入力の座標系で解析が行われます。GeoAnalytics Tools の場合、最終結果は WGS84 のビッグ データ ストアに保存されます。

ライセンス情報

  • Basic: 次のものが必要 ArcGIS GeoAnalytics Server
  • Standard: 次のものが必要 ArcGIS GeoAnalytics Server
  • Advanced: 次のものが必要 ArcGIS GeoAnalytics Server

関連トピック