描述
将要素汇总到所计算的字段统计信息、样本要素和范围边界中。
插图
使用方法
以下是您可使用描述数据集工具执行的操作示例:
- 验证您是否已将时间和几何正确注册到大数据文件共享。
- 了解属性值和汇总字段统计数据。
- 使用样本图层可视化您的大数据。绘制样本,而不是绘制一百万个要素。
- 在针对更长时间和更大规模的处理进行扩展前,使用数据样本运行工作流。
- 通过计算地理范围来确定数据集的位置。
默认情况下,该工具会输出一个表,包含输入图层中每个字段的汇总统计数据。此外,还会将表打印到地理处理窗口,以描述输入图层的所有几何或时间属性。
如果输入图层具有几何,则该工具将打印描述输入图层的以下几何属性的表:
- Geometry type - 输入图层的几何类型。该值为点、线或面。
- Spatial reference - 输入图层的空间参考。
- Count of non-empty features - 在输入图层的空间参考范围内具有有效几何的要素数。
- Count of empty features - 没有有效几何的要素数。这些要素可能具有空几何,或者几何可能位于所使用的空间参考的范围之外。
- Spatial extent - 输入图层中要素的空间范围。
如果输入图层启用了时间,则该工具将打印描述输入图层的以下时间属性的表:
- Time type - 输入图层的时间类型。该值为时刻或间隔。
- Count of non-empty features - 具有有效时间值的要素数。
- Count of empty features - 时间值为空或无效的要素数。
- Temporal extent - 输入图层中要素的时间范围。该值包含开始时间和结束时间。
使用采样要素数参数,以指定要采样的要素数量。如果将其留空或选择 0,则不会创建任何样本。该输出子集会具有与输入要素相同的方案、几何和时间设置。子集可用于了解数据集在添加到地图或在属性表中可视化时的显示方式。此外,您可以对子集运行分析,以确定进行大数据分析的最佳输入。
如果指定的样本大小大于输入要素总数,则将返回所有要素。
样本图层并不代表真正随机的地理选择,不应用于了解数据的地理范围或分布。例如,如果您将采样要素数指定为 230 个要素,则结果可以包含以任何顺序排列或位于任何位置的 230 个输入要素。
使用范围图层输出参数,创建用于描述输入数据集范围的边界要素。该输出将包含表示输入要素地理范围的单个面要素。范围图层可用于确定数据存储的位置,或将其用作工作流中其他位置的输入。例如,将其用作使用 GeoAnalytics 裁剪图层工具裁剪要素所形成的面图层。
您只能选择为点、线和面要素创建范围图层。将不会为表格要素创建范围图层。
或者,可使用环境设置来指定要素的输出方式。
例如,可使用范围环境来输出表示感兴趣区域的范围图层,或从定义的研究区域输出样本要素。
此外,可使用输出坐标系环境将输出内容投影到所需的空间参考。
您可以通过执行以下操作来提高“描述数据集”工具的性能:
- 设置数据范围,以便仅分析感兴趣的数据。
- 生成更少的样本要素。
- 将本地数据用于分析运行的位置。
此地理处理工具由 Spark 作为支持。可在台式计算机上并行使用多个核来完成分析。要了解有关运行分析的详细信息,请参阅 GeoAnalytics Desktop 工具的注意事项。
运行 GeoAnalytics Desktop 工具时,将在台式计算机上完成分析。为获得最佳性能,应在桌面上提供数据。如果您使用的是托管要素图层,则建议使用 ArcGIS GeoAnalytics Server。如果您的数据不是本地数据,则运行工具需要更长时间。要使用 ArcGIS GeoAnalytics Server 执行分析,请参阅 GeoAnalytics 工具。
语法
arcpy.gapro.DescribeDataset(input_layer, output, {sample_features}, {sample_layer}, {extent_layer})
参数 | 说明 | 数据类型 |
input_layer | 要描述的点、线、面或表格要素。 | Table View |
output | 包含汇总信息的新表。 | Table |
sample_features (可选) | 将包含在输出样本图层中的要素数量。如果选择 0 个要素或不提供数量,则不会返回任何样本。默认情况下,不返回任何样本图层。 | Long |
sample_layer (可选) | 包含输入数据样本的新要素类。 | Table; Feature Class |
extent_layer (可选) | 包含输入数据的空间和时态范围的新要素类。 | Feature Class |
代码示例
以下 Python 窗口脚本演示了如何使用 DescribeDataset 工具。
此脚本中描述了网络要素,并创建了 2500 个要素的样本图层。
#-------------------------------------------------------------------------------
# Name: DescribeDataset.py
# Description:
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/RedRiver_basin.gdb"
# Set local variables
inputDataset = "WaterSample"
output = "WSample_summary"
sample = "WSample_sample2500"
# Execute Describe Dataset
arcpy.gapro.DescribeDataset(inputDataset, output, 2500, sample)
许可信息
- Basic: 否
- Standard: 否
- Advanced: 是