描述数据集 (GeoAnalytics Desktop)

描述

将要素汇总到所计算的字段统计信息、样本要素和范围边界中。

插图

描述数据集工作流示意图

使用方法

  • 以下是您可使用描述数据集工具执行的操作示例:

    • 验证您是否已将时间和几何正确注册到大数据文件共享。
    • 了解属性值和汇总字段统计数据。
    • 使用样本图层可视化您的大数据。绘制样本,而不是绘制一百万个要素。
    • 在针对更长时间和更大规模的处理进行扩展前,使用数据样本运行工作流。
    • 通过计算地理范围来确定数据集的位置。

  • 默认情况下,该工具将输出一个表,其中包含每个字段的汇总统计数据以及一个用于描述输入图层属性的 JSON。

  • 使用采样要素数参数,以指定要采样的要素数量。如果将其留空或选择 0,则不会创建任何样本。该输出子集会具有与输入要素相同的方案、几何和时间设置。子集可用于了解数据集在添加到地图或在属性表中可视化时的显示方式。此外,您可以对子集运行分析,以确定进行大数据分析的最佳输入。

  • 如果指定的样本大小大于输入要素总数,则将返回所有要素。

  • 样本图层并不代表真正随机的地理选择,不应用于了解数据的地理范围或分布。例如,如果您将采样要素数指定为 230 个要素,则结果可以包含以任何顺序排列或位于任何位置的 230 个输入要素。

  • 使用范围图层输出参数,创建用于描述输入数据集范围的边界要素。该输出将包含表示输入要素地理范围的单个面要素。范围图层可用于确定数据存储的位置,或将其用作工作流中其他位置的输入。例如,将其用作使用 GeoAnalytics 裁剪图层工具裁剪要素所形成的面图层。

  • 您只能选择为点、线和面要素创建范围图层。将不会为表格要素创建范围图层。

  • 或者,可使用环境设置来指定要素的输出方式。

    例如,可使用范围环境来输出表示感兴趣区域的范围图层,或从定义的研究区域输出样本要素。

    此外,可使用输出坐标系环境将输出内容投影到所需的空间参考。

  • 您可以通过执行以下操作来提高“描述数据集”工具的性能:

    • 设置数据范围,以便仅分析感兴趣的数据。
    • 生成更少的样本要素。
    • 本地数据用于分析运行的位置。

  • 此地理处理工具由 Spark 作为支持。可在台式计算机上并行使用多个核来完成分析。要了解有关运行分析的详细信息,请参阅 GeoAnalytics Desktop 工具的注意事项

  • 运行 GeoAnalytics Desktop 工具时,将在台式计算机上完成分析。为获得最佳性能,应在桌面上提供数据。如果您使用的是托管要素图层,则建议使用 ArcGIS GeoAnalytics Server。如果您的数据不是本地数据,则运行工具需要更长时间。要使用 ArcGIS GeoAnalytics Server 执行分析,请参阅 GeoAnalytics 工具

语法

DescribeDataset(input_layer, output, {sample_features}, {sample_layer}, {extent_layer})
参数说明数据类型
input_layer

要描述的点、线、面或表格要素。

Table View
output

包含汇总信息的新表。

Table
sample_features
(可选)

将包含在输出样本图层中的要素数量。如果选择 0 个要素或不提供数量,则不会返回任何样本。默认情况下,不返回任何样本图层。

Long
sample_layer
(可选)

包含输入数据样本的新要素类。

Table; Feature Class
extent_layer
(可选)

包含输入数据的空间和时态范围的新要素类。

Feature Class

代码示例

DescribeDataset 示例(Python 窗口)

以下 Python 窗口脚本演示了如何使用 DescribeDataset 工具。

此脚本中描述了网络要素,并创建了 2500 个要素的样本图层。

#-------------------------------------------------------------------------------
# Name: DescribeDataset.py
# Description: 
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/RedRiver_basin.gdb"
# Set local variables
inputDataset = "WaterSample"
output = "WSample_summary"
sample = "WSample_sample2500"
# Execute Describe Dataset
arcpy.gapro.DescribeDataset(inputDataset, output, 2500, sample)

许可信息

  • Basic: 否
  • Standard: 否
  • Advanced: 是

相关主题