属性の集計 (Summarize Attributes) (GeoAnalytics)

サマリー

フィーチャクラス内のフィールドの要約統計量を計算します。

使用法

  • [属性の集計 (Summarize Attributes)] は空間解析ツールではなく、表形式の解析ツールです。表形式のレイヤーか、ジオメトリを持つレイヤー (ポイント、ライン、ポリゴン) を入力として使用できます。

  • 1 つ以上のフィールドを指定して集計するか、すべてのフィーチャを集計できます。フィールドで集計する場合、統計情報は、属性値の一意の組み合わせごとに計算されます。

  • [出力テーブル] は、統計演算の結果を含むフィールドで構成されます。

  • 次の命名規則を使用して、指定した各統計情報タイプのフィールドが作成されます。sum_<field>max_<field>min_<field>range_<field>std_<field>count_<field>var_<field>、および any_<field> (ここで、<field> は、統計情報が計算される入力フィールドの名前です)。統計情報は、各グループで個別に計算されます。

  • 入力で時間が有効化されている場合、時間ステップを解析に適用できます。各時間ステップは、時間ステップ外のフィーチャとは切り離して解析されます。時間ステップを使用するには、入力データを時間対応にし、任意の時点を時間で表す必要があります。時間ステップを適用すると、出力フィーチャは START_DATETIME および END_DATETIME フィールドで表した時間間隔になります。

    時間ステップの詳細

  • このツールを空間データに適用すると、表形式の結果を得ることができます。[フィーチャの結合] を使用し、空間データに結果を結合することができます。

  • 次のテーブルでは、類似したフィールド値を使用して集計されたレイヤーの統計計算を示します。レイヤーの数値統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差]、および [分散]) の計算には、[VO2] フィールドを使用しています。レイヤーの文字列統計情報 ([個数][すべて]) の計算には、[Rating] フィールドを使用しています。

    集計する入力レイヤー
    集計される入力レイヤーを示します。

    上記のテーブルは [Designation] フィールドで集計されており、レイヤーの数値統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差][分散]) の計算には、[VO2] フィールドを使用しています。レイヤーの文字列統計情報 ([個数][すべて]) の計算には、[Rating] フィールドを使用しています。これにより、異なる [Designation] 値を表す、2 つのフィーチャを持つテーブルが生成されます。

    [Designation] フィールドを使用して集計された入力レイヤー
    [Designation] フィールドを使用して集計された入力レイヤーを示します。

    次のテーブルでは、[Designation] フィールドと [Age Group] フィールドを使用してレイヤーを集計したときの、最初のいくつかのフィールドを示します。統計は、前の例と同じ方法で計算されます。

    [Designation] フィールドと [Age Group] フィールドを使用して集計された入力レイヤー
    [Designation] フィールドと [Age Group] フィールドを使用して集計された入力レイヤーを示します。
  • 次のヒントを使用することで、[属性の集計 (Summarize Attributes)] ツールのパフォーマンスを向上させることができます。

    • 対象データのみを解析するように、範囲環境を設定します。
    • 解析が実行されている場所に対してローカルなデータを使用します。

  • このジオプロセシング ツールは、ArcGIS GeoAnalytics Server を活用しています。 解析は GeoAnalytics Server で実行され、結果が ArcGIS Enterprise のコンテンツに保存されます。

  • GeoAnalytics Server ツールを実行する場合、解析は GeoAnalytics Server で実行されます。 最適なパフォーマンスを得るためには、ArcGIS Enterprise ポータルでホストされているフィーチャ レイヤーかビッグ データ ファイル共有を通じて、GeoAnalytics Server にデータを提供する必要があります。 GeoAnalytics Server のローカルにないデータは、解析が開始する前に GeoAnalytics Server に移動されます。 つまり、ツールを実行する時間が長くなり、場合によっては ArcGIS Pro から GeoAnalytics Server にデータを移動できないこともあります。 エラーの閾値はネットワークの速度や、データのサイズや複雑さに左右されます。 データを必ず共有するか、ビッグ データ ファイル共有を作成することをお勧めします。

    データをポータルで共有する方法の詳細

    ArcGIS Server Manager を使用してビッグ データ ファイル共有を作成する方法の詳細

  • [解析] ツールボックスの [要約統計量 (Summary Statistics)] ツールを使用して、同様の解析を実行することもできます。

パラメーター

ラベル説明データ タイプ
入力レイヤー

集計するポイント レイヤー、ポリライン レイヤー、またはポリゴン レイヤー。

Record Set
出力名

出力フィーチャ サービスの名前。

String
フィールド

同様なフィーチャの集計に使用する 1 つまたは複数のフィールド。たとえば、商業地と住宅地の値を含む PropertyType フィールドを選択すると、住宅地の値を持つすべてのフィールドが集計されて統計情報のサマリーが算出され、商業地の値を持つすべてのフィールドが集計されます。この例では、商業地と住宅地のサマリー値の 2 行が出力に作成されます。

Field
集計フィールド
(オプション)

指定されたフィールドに関して計算される統計情報。

Value Table
データストア
(オプション)

出力の保存先の ArcGIS Data Store を指定します。 デフォルトは、[ビッグ データ ストア] です。 ビッグ データ ストアに格納されたすべての結果は、WGS84 で保存されます。 リレーショナル データ ストアに格納された結果は、それらの座標系を維持します。

  • ビッグ データ ストア出力がビッグ データ ストアに格納されます。 これがデフォルトです。
  • リレーショナル データ ストア出力がリレーショナル データ ストアに格納されます。
String
時間ステップの間隔
(オプション)

時間ステップの期間を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

時間ステップは、入力が時間対応である場合にのみ適用できます。

Time Unit
時間ステップの反復
(オプション)

時間ステップの間隔が発生する頻度を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

Time Unit
時間ステップの基準
(オプション)

時間ステップを揃える基準時間を指定する日付。 デフォルト値は、1970 年 1 月 1 日 12:00 a.m. です。このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

Date

派生した出力

ラベル説明データ タイプ
出力

集計された属性を含む出力テーブル。

レコード セット

arcpy.geoanalytics.SummarizeAttributes(input_layer, output_name, fields, {summary_fields}, {data_store}, {time_step_interval}, {time_step_repeat}, {time_step_reference})
名前説明データ タイプ
input_layer

集計するポイント レイヤー、ポリライン レイヤー、またはポリゴン レイヤー。

Record Set
output_name

出力フィーチャ サービスの名前。

String
fields
[fields,...]

同様なフィーチャの集計に使用する 1 つまたは複数のフィールド。たとえば、商業地と住宅地の値を含む PropertyType フィールドを選択すると、住宅地の値を持つすべてのフィールドが集計されて統計情報のサマリーが算出され、商業地の値を持つすべてのフィールドが集計されます。この例では、商業地と住宅地のサマリー値の 2 行が出力に作成されます。

Field
summary_fields
[summary_fields,...]
(オプション)

指定されたフィールドに関して計算される統計情報。

  • COUNT - NULL 値でない値の数。 数値フィールドまたは文字列に使用できます。 [null, 0, 2] の個数は 2 です。
  • SUM - フィールド内の数値の合計。 [null, null, 3] の合計は 3 です。
  • MEAN - 数値の平均。 [0,2, null] の平均は 1 です。
  • MIN - 数値フィールドの最小値。 [0, 2, null] の最小値は 0 です。
  • MAX - 数値フィールドの最大値。 [0, 2, null] の最大値は 2 です。
  • STDDEV - 数値フィールドの標準偏差。 [1] の標準偏差は null です。 [null, 1,1,1] の標準偏差は null です。
  • VAR - トラッキング内の数値フィールドの分散。 [1] の分散は null です。 [null, 1,1,1] の分散は null です。
  • RANGE - 数値フィールドの範囲。 これは、最大値から最小値を減算して計算されます。 [0, null, 1] の範囲は 1 です。 [null, 4] の範囲は 0 です。
  • ANY - 文字列型のフィールドのサンプル文字列。

Value Table
data_store
(オプション)

出力の保存先の ArcGIS Data Store を指定します。 デフォルトは、SPATIOTEMPORAL_DATA_STORE です。 ビッグ データ ストアに格納されたすべての結果は、WGS84 で保存されます。 リレーショナル データ ストアに格納された結果は、それらの座標系を維持します。

  • SPATIOTEMPORAL_DATA_STORE出力がビッグ データ ストアに格納されます。 これがデフォルトです。
  • RELATIONAL_DATA_STORE出力がリレーショナル データ ストアに格納されます。
String
time_step_interval
(オプション)

時間ステップの期間を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

時間ステップは、入力が時間対応である場合にのみ適用できます。

Time Unit
time_step_repeat
(オプション)

時間ステップの間隔が発生する頻度を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

Time Unit
time_step_reference
(オプション)

時間ステップを揃える基準時間を指定する日付。 デフォルト値は、1970 年 1 月 1 日 12:00 a.m. です。このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

Date

派生した出力

名前説明データ タイプ
output

集計された属性を含む出力テーブル。

レコード セット

コードのサンプル

SummarizeAttributes (属性の集計) (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、SummarizeAttributesツールの使用方法を示しています。

#-------------------------------------------------------------------------------
# Name: Summarize Attributes.py
# Description: Summarize Crime Data by year and beat.
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
# This example used a big data file share name "Crimes" with dataset "Chicago" registered on my GeoAnalytics server
inFeatures = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Crimes/BigDataCatalogServer/Chicago"
summaryFields = ["Year", "Beat"]
summaryStatistics = [["Arrest", "COUNT"], ["District", "COUNT"]]
outFS = 'SummarizeCrimes'
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute SummarizeAttributes
arcpy.geoanalytics.SummarizeAttributes(inFeatures, outFS, summaryFields, 
                                       summaryStatistics, dataStore)

環境

特殊なケース

出力座標系

解析で使用される座標系。 このパラメーターで指定されない限り、入力の座標系で解析が行われます。 GeoAnalytics Tools の場合、最終結果は WGS84 のビッグ データ ストアに保存されます。

ライセンス情報

  • Basic: 次のものが必要 ArcGIS GeoAnalytics Server
  • Standard: 次のものが必要 ArcGIS GeoAnalytics Server
  • Advanced: 次のものが必要 ArcGIS GeoAnalytics Server

関連トピック