時空間キューブの作成 (Create Space Time Cube) (GeoAnalytics)

概要

時空間ビンにポイントのセットを集めることで、netCDF データ構造にポイントを集約します。各ビンで、ポイントが計算され、指定された属性が集約されます。 すべてのビンの位置に対して、ポイント数の傾向と集計フィールドの値が評価されます。

時空間キューブの作成

使用法

  • このツールは、ポイント レイヤーのフィーチャを時空間ビンに集約します。 作成されるデータ構造は、空間を表す x ディメンションと y ディメンションおよび時間を表す t ディメンションを持つ時空間ビンで構成された 3 次元キューブと考えることができます。

    3 次元キューブ内の時空間ビン

  • ビンごとに、空間 (x,y) と時間 (t) の固定された位置があります。同じ (x,y) エリアをカバーするビンは、同じロケーション ID を共有します。同じ期間を含むビンは、同じ時間ステップ ID を共有します。ポイント データが矩形でなくてもキューブは必ず矩形であるため、すべての時間ステップに対してゼロのポイント数を持つ場所もあります。 多くの分析では、データを持つ場所 (少なくとも 1 つの時間ステップにおいて 1 より大きいポイント数を少なくとも 1 つ持つ) だけが分析に含められます。

    時空間キューブ内の位置

  • 時空間キューブ内のビンは、LOCATION_IDtime_step_IDCOUNT フィールド値、およびキューブの作成時に集計された [集計フィールド] の値を保持します。物理的に同じ位置に関連付けられているビンは、同じロケーション ID を共有し、共に時系列を示します。同じ時間ステップ間隔に関連付けられているビンは、同じ時間ステップ ID を共有し、共にタイム スライスを構成します。各ビンのカウント値は、関連付けられた時間ステップ間隔中に、関連付けられた場所で発生したポイント数を反映します。

  • [ポイント レイヤー] パラメーター は、犯罪や火事のイベント、病気のインシデント、顧客の売上データ、交通事故などのポイントである必要があります。各ポイントには日付が関連付けられている必要があります。このツールでは、60 個以上のポイントとさまざまなタイムスタンプが必要です。 指定したパラメーターによってキューブ内に 20 億個以上のビンが生成されると、このツールは失敗します。

  • このツールで距離を正確に測定するには、投影されたデータが必要です。

  • このツールの出力は、入力ポイントの netCDF 表現です。 生成された時空間キューブは、解析を実行するコンピューターに直接ダウンロードされます。その場所は、ツールのメッセージで指定されます。

  • データセットの時間的な分布が等間隔であることは、珍しいことではありません。たとえば、年次データがすべて各年の 1 月 1 日にある場合や、月次データのタイムスタンプがすべて各月の最初である場合があります。 この種のデータは、よくパネル データと呼ばれます。パネル データを使用すると、時間的バイアスの計算で高いパーセンテージが示されることがよくあります。この状況が発生するのは、指定された時間ステップで、各ビンが 1 つの特定の時間単位のみをカバーするためです。たとえば、1 年の [時間間隔] を選択し、データが各年の 1 月 1 日にある場合、各ビンは 1 年のうちの 1 日だけをカバーします。 これは、各ビンに適用されるため、まったく問題ありません。時間的バイアスが問題になるのは、実際のデータの分布ではなく、ビンの作成パラメーターが原因で特定のビンにのみ存在する場合です。データの分布に基づいて、各ビンの予想される範囲の観点から時間的バイアスを評価することが重要です。

  • 出力レポートの時間的バイアスは、データが存在しない期間のパーセンテージとして算出されます。たとえば、空のビンの時間的バイアスは 100% です。期間が 1 か月、[時間間隔の配列] が [終了時間] のビンで、最初の時間ステップが後半の 2 週間のデータのみの場合、最初の時間ステップの時間的バイアスは 50% です。 期間が 1 か月、[時間間隔の配列] が [開始時間] のビンで、最後の時間ステップが前半の 2 週間のデータのみの場合、最後の時間ステップの時間的バイアスは 50% です。

  • 時空間キューブを作成したら、キューブの空間範囲は拡張できません。

  • [基準時間] パラメーターには、日時の値または日付のみの値を指定できますが、時間のみの値を指定することはできません。

  • 分析に適した [距離間隔] を使用します。ポイント データの基本パターンが失われた非常に大きな距離間隔とキューブにゼロ カウントが入力されている非常に小さな距離間隔との間のバランスを見つけます。
  • 集約されたカウント データと集計フィールドの値に対して実行される傾向分析は、Mann-Kendall 統計に基づいています。

  • このツールで実行できる属性の集約に対する統計演算は、合計値、平均値、最小値、最大値、および標準偏差です。

  • SPATIAL_NEIGHBORS を使用して空のビンを埋めるときは、2 次近傍 (近傍と、近傍の近傍を含む) の Queens Case Contiguity (エッジおよびコーナーに基づく隣接) が使用されます。このオプションを使用して空のビンを埋めるには、最低 4 つの空間近傍が必要です。

  • SPACE_TIME_NEIGHBORS を使用して空のビンを埋めるときは、2 次近傍 (近傍と、近傍の近傍を含む) の Queens Case Contiguity (エッジおよびコーナーに基づく隣接) が使用されます。さらに、空間近傍になったビンには、2 つの時間ステップを往復することで時間近傍が使用されます。このオプションを使用して空のビンを埋めるには、最低 13 の時空間近傍が必要です。

  • TEMPORAL_TREND を使用して空のビンを埋める場合は、指定された位置のその他の期間に値を内挿するために、その位置の最初の 2 つの期間と最後の 2 つの期間のビンに値を入力する必要があります。

  • 集計フィールド レコードに NULL 値が存在する場合、そのフィーチャは解析から除外されます。解析方法の一環として各ビン内のポイント数を設定する場合、カウント用 (集計フィールドなし) と集計フィールド用に別々のキューブを作成することを検討してください。それぞれの集計フィールドで、NULL 値のセットが異なる場合も、各集計フィールドに対して別々のキューブを作成することを検討してください。

  • ジオプロセシング ツールは、ArcGIS GeoAnalytics Server を活用しています。解析は GeoAnalytics Server で実行され、結果が ArcGIS Enterprise のコンテンツに保存されます。

  • GeoAnalytics Server ツールを実行する場合、解析は GeoAnalytics Server で実行されます。最適なパフォーマンスを得るためには、ArcGIS Enterprise ポータルでホストされているフィーチャ レイヤーかビッグ データ ファイル共有を通じて、GeoAnalytics Server にデータを提供する必要があります。GeoAnalytics Server のローカルにないデータは、解析が開始する前に GeoAnalytics Server に移動されます。つまり、ツールを実行する時間が長くなり、場合によっては ArcGIS Pro から GeoAnalytics Server にデータを移動できないこともあります。エラーの閾値はネットワークの速度や、データのサイズや複雑さに左右されます。したがって、データを必ず共有するか、ビッグ データ ファイル共有を作成することをお勧めします。

    データをポータルで共有する方法の詳細

    ArcGIS Server Manager を使用してビッグ データ ファイル共有を作成する方法の詳細

  • 次のツールを使用して、類似の解析を実行することもできます。

構文

arcpy.geoanalytics.CreateSpaceTimeCube(point_layer, output_name, distance_interval, time_step_interval, {time_step_interval_alignment}, {reference_time}, {summary_fields})
パラメーター説明データ タイプ
point_layer

時空間ビンに集約する入力ポイント フィーチャクラス。

Feature Set
output_name

入力フィーチャ ポイント データの個数と要約を格納するために作成する出力 netCDF データ キューブ。

String
distance_interval

ビン サイズを決定する距離。

point_layer の集約に使用するビンのサイズ。同じ distance_interval および time_step_interval 内のすべてのポイントが集約されます。

Linear Unit
time_step_interval

1 つの時間ステップを表す秒、分、時間、日、週、または年の数。同じ time_step_interval および distance_interval 内のすべてのポイントが集約されます。このパラメーターの有効な入力例として、1 週間、13 日、1 か月などがあります。

Time Unit
time_step_interval_alignment
(オプション)

[時間間隔] (Python では time_step_interval) パラメーターに基づく集約方法を指定します。

  • END_TIME時間ステップは最後の時間イベントに揃えられ、前の時間が集約されます。
  • START_TIME時間ステップは最初の時間イベントに揃えられ、後の時間が集約されます。
  • REFERENCE_TIME時間ステップは、指定された日付または時間に揃えられます。 入力フィーチャ内のすべてのポイントのタイムスタンプが、指定した基準時間より大きい値の場合 (または入力フィーチャの開始時間である場合)、時間ステップ間隔はその基準時間から開始され、([開始時間] の配列のように) 後の時間が集約されます。 入力フィーチャ内のすべてのポイントのタイムスタンプが、指定した基準時間より小さい場合 (または、入力フィーチャの終了時間である場合)、時間ステップ間隔はその基準時間で終了し、([終了時間] の配列のように) 前の時間が集約されます。 指定した [基準時間] がデータの時間範囲の中間にある場合、時間ステップ間隔は、([終了時間] の配列のように) 指定した基準時間で終了して作成されます。データの全時間範囲がカバーされるまで、基準時間の前と後にさらに時間ステップ間隔が作成されます。
String
reference_time
(オプション)

時間ステップ間隔を揃えるのに使用される日付または時間。たとえば、データを月曜から日曜までの 1 週間でビン化するには、日曜の基準時間を午前 0 時に設定して、ビンが日曜と月曜の間の午前 0 時にブレークするようにします。 ,

Date
summary_fields
[summary_fields,...]
(オプション)

時空間キューブに集約するときに、指定された統計情報の計算に使用する属性値を含む数値フィールド。複数の統計情報とフィールドの組み合わせを指定できます。すべての統計情報計算から NULL 値が除外されます。

使用できる統計情報タイプは次のとおりです。

  • 合計 - 各ビン内の指定されたフィールドの値の合計を追加します。
  • 平均 - 各ビン内の指定されたフィールドの平均を計算します。
  • 最小 - 各ビン内の指定されたフィールドのすべてのレコードの中で最も小さい値を検出します。
  • 最大 - 各ビン内の指定されたフィールドのすべてのレコードの中で最も大きい値を検出します。
  • 標準偏差 - 各ビン内の指定されたフィールドの値の標準偏差を検出します。

使用できる入力タイプは次のとおりです。

  • ゼロ - 空のビンをゼロで埋めます。
  • 空間近傍 - 空のビンを空間近傍の平均値で埋めます。
  • 時空間近傍 - 空のビンを時空間近傍の平均値で埋めます。
  • 時系列的トレンド - Interpolated Univariate Spline アルゴリズムを使用して、空のビンを埋めます。

メモ:
いずれかの集計フィールドに NULL 値が存在する場合、そのフィーチャは解析から除外されます。解析方法の一環として各ビン内のポイント数を設定する場合、カウント用 (集計フィールドなし) と集計フィールド用に別々のキューブを作成することを検討してください。それぞれの集計フィールドで、NULL 値のセットが異なる場合も、各集計フィールドに対して別々のキューブを作成することを検討してください。

Value Table

派生した出力

名前説明データ タイプ
output

集約された時空間キューブ。

ファイル

コードのサンプル

CreateSpaceTimeCube (時空間キューブの作成) (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、CreateSpaceTimeCubeツールの使用方法を示しています。

#-------------------------------------------------------------------------------
# Name: CreateSpaceTimeCube.py
# Description: Create a cube representing the counts of Crimes
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inFeatures = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Crimes/BigDataCatalogServer/Chicago"
outCube = "CrimeCube.nc"
# Execute Create Space Time Cube
arcpy.geoanalytics.CreateSpaceTimeCube(inFeatures, outCube, "1 Kilometers", 
                                       "1 Weeks", "START_TIME")

環境

出力座標系

解析で使用される座標系。このパラメーターで指定されない限り、入力の座標系で解析が行われます。GeoAnalytics Tools の場合、最終結果は WGS84 のビッグ データ ストアに保存されます。

ライセンス情報

  • Basic: 次のものが必要 ArcGIS GeoAnalytics Server
  • Standard: 次のものが必要 ArcGIS GeoAnalytics Server
  • Advanced: 次のものが必要 ArcGIS GeoAnalytics Server

関連トピック