概要
フィーチャを集計して、フィールド統計情報、サンプル フィーチャ、範囲境界を算出します。
図
使用法
[データセットの記述 (Describe Dataset)] ツールの機能例を以下に示します。
- ビッグ データ ファイル共有に時間とジオメトリを正しく登録できていることを確認します。
- 集約されたフィールド統計情報を使用して、属性値を把握します。
- サンプル レイヤーを使用してビッグ データを視覚化します。100 万個のフィーチャを描画する代わりに、サンプルを描画します。
- 長時間および大規模な処理を行うためにスケーリングする前に、サンプル データを使用してワークフローを実行します。
- 地理的範囲を計算して、データセットの場所を特定します。
デフォルトで、このツールは、入力レイヤー内の各フィールドの統計情報のサマリーを含むテーブルを出力します。また、入力レイヤーのジオメトリ プロパティまたは時間プロパティが記述されたテーブルもジオプロセシング ウィンドウに出力されます。
入力レイヤーにジオメトリが含まれている場合、このツールは、入力レイヤーの次のジオメトリ プロパティが記述されたテーブルを出力します。
- [Geometry type] - 入力レイヤーのジオメトリ タイプ。この値は、ポイント、ライン、またはポリゴンのいずれかです。
- [Spatial reference] - 入力レイヤーの空間参照。
- [Count of non-empty features] - 入力レイヤーの空間参照の範囲内の有効なジオメトリが含まれているフィーチャの数。
- [Count of empty features] - 有効なジオメトリが含まれていないフィーチャの数。これらのフィーチャに空のジオメトリが含まれているか、該当するジオメトリが使用している空間参照の範囲外である可能性があります。
- [Spatial extent] - 入力レイヤー内のフィーチャの空間範囲。
入力レイヤーが時間対応の場合、このツールは、入力レイヤーの次の時間プロパティが記述されたテーブルを出力します。
- [Time type] - 入力レイヤーの時間タイプ。この値は即時または間隔のいずれかです。
- [Count of non-empty features] - 有効な時間値が含まれているフィーチャの数。
- [Count of empty features] - NULL 値または無効な時間値が含まれているフィーチャの数。
- [Temporal extent] - 入力レイヤー内のフィーチャの時間範囲。この値は開始時間と終了時間で構成されます。
[サンプル フィーチャ数] パラメーターを使用して、サンプルにフィーチャ数を指定します。このパラメーターを空白のままにするか、0 を選択すると、サンプルは作成されません。出力サブセットには、入力フィーチャと同じスキーマ、ジオメトリ、および時間設定が含まれています。サブセットを使用して、データセットがマップに追加されるか、属性テーブルで視覚化された場合の外観を把握できます。さらに、サブセットに対して解析を実行することで、大規模な分析を行う際の最適な入力を決定することができます。
サンプル サイズを入力フィーチャの合計数より大きい数を指定すると、すべてのフィーチャが返されます。
サンプル レイヤーは、正確にランダムなジオグラフィを表すものではないため、データの地理的範囲や分布を理解するためには使用しないでください。たとえば、[サンプル フィーチャ数] に「230」個のフィーチャを指定した場合、結果には順番や場所が考慮されない 230 個の入力フィーチャが含まれます。
[範囲レイヤー] 出力パラメーターを使用して、入力データセットの範囲を表す境界フィーチャを作成します。出力は、入力フィーチャの地理的範囲を表す単一のポリゴン フィーチャになります。範囲レイヤーを使用して、データが保存されている場所を判定したり、ワークフローの他の箇所でデータを入力として使用したりできます。たとえば、[レイヤーのクリップ (Clip Layer)] GeoAnalytics ツールを使用して、フィーチャをクリップするポリゴン レイヤーとして範囲レイヤーを使用できます。
ポイント、ライン、ポリゴン フィーチャの範囲を作成するオプションのみがあります。テーブル フィーチャの範囲レイヤーは作成されません。
必要に応じて、環境設定を使用して、フィーチャの出力方法を指定します。
たとえば、[範囲] 環境を使用して、対象地域を表す範囲レイヤー、または定義された分析範囲のサンプル フィーチャを出力します。
さらに、[出力座標系] 環境を使用して、目的の空間参照に出力を投影します。
以下を行うことで、[データセットの記述 (Describe Dataset)] ツールのパフォーマンスを向上させることができます。
- 対象データのみを解析するように、データの範囲を設定します。
- 生成するサンプル フィーチャを少なくします。
- 解析が実行されている場所に対してローカルなデータを使用します。
ジオプロセシング ツールは、Spark を活用しています。解析は、複数のコアを並列に使用して、デスクトップ コンピューター上で実行されます。解析の実行方法の詳細については、「GeoAnalytics Desktop ツールに関する考慮事項」をご参照ください。
GeoAnalytics Desktop ツールを実行する場合、解析はデスクトップ コンピューター上で実行されます。最適なパフォーマンスを実現するには、データがデスクトップ上で使用可能である必要があります。ホスト フィーチャ レイヤーを使用している場合は、ArcGIS GeoAnalytics Server を使用することをお勧めします。データがローカルに存在していない場合、ツールの実行時間が長くなります。ArcGIS GeoAnalytics Server を使用して分析を行うには、GeoAnalytics Toolsをご参照ください。
構文
arcpy.gapro.DescribeDataset(input_layer, output, {sample_features}, {sample_layer}, {extent_layer})
パラメーター | 説明 | データ タイプ |
input_layer | 記述対象のポイント、ライン、ポリゴン、またはテーブル フィーチャ。 | Table View |
output | サマリー情報を持つ新しいテーブル。 | Table |
sample_features (オプション) | 出力サンプル レイヤーに含まれるフィーチャの数。0 を選択するか、数値を指定しない場合は、サンプルは返されません。デフォルトでは、サンプル レイヤーは返されません。 | Long |
sample_layer (オプション) | 入力データのサンプルを持つ新しいフィーチャクラス。 | Table; Feature Class |
extent_layer (オプション) | 入力データの空間および時間範囲を持つ新しいフィーチャクラス。 | Feature Class |
コードのサンプル
次の Python ウィンドウ スクリプトは、DescribeDatasetツールの使用方法を示しています。
このスクリプトでは、ネットワーク フィーチャが記述され、2500 フィーチャのサンプル レイヤーが作成されます。
#-------------------------------------------------------------------------------
# Name: DescribeDataset.py
# Description:
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/RedRiver_basin.gdb"
# Set local variables
inputDataset = "WaterSample"
output = "WSample_summary"
sample = "WSample_sample2500"
# Execute Describe Dataset
arcpy.gapro.DescribeDataset(inputDataset, output, 2500, sample)
環境
ライセンス情報
- Basic: いいえ
- Standard: いいえ
- Advanced: はい