子集化要素 (数据管理)

摘要

可将要素类或表的记录划分为两个子集:一个子集用作训练数据,另一个子集用作测试要素以比较和验证输出表面。

使用情况

  • 随机数生成器环境中,仅支持 Mersenne Twister 选项。 如果选择其他选项,则将使用 Mersenne Twister。

  • 将数据集划分为训练要素和测试要素在插值、机器学习以及其他分析工作流中比较常见,这些工作流涉及根据数据来估计和构建模型。

  • 如果使用多部分要素作为输入,则输出将为多部分要素的子集,而非单个要素。

参数

标注说明数据类型
输入要素

将根据其创建子集的要素或表。

Table View
输出训练要素类

将创建的训练要素的子集。

Feature Class; Table
输出测试要素类
(可选)

将创建的测试要素的子集。

Feature Class; Table
训练要素子集的大小
(可选)

输出训练要素类的大小,以输入要素的百分比或者要素的绝对数量形式输入。

Double
子集大小单位
(可选)

指定子集大小值将用作输入要素的百分比,还是要素的绝对数量。

  • 输入的百分比子集大小将用作训练数据集中输入要素的百分比。
  • 绝对值子集大小将用作训练数据集中要素的数量。
Boolean

arcpy.management.SubsetFeatures(in_features, out_training_feature_class, {out_test_feature_class}, {size_of_training_dataset}, {subset_size_units})
名称说明数据类型
in_features

将根据其创建子集的要素或表。

Table View
out_training_feature_class

将创建的训练要素的子集。

Feature Class; Table
out_test_feature_class
(可选)

将创建的测试要素的子集。

Feature Class; Table
size_of_training_dataset
(可选)

输出训练要素类的大小,以输入要素的百分比或者要素的绝对数量形式输入。

Double
subset_size_units
(可选)

指定子集大小值将用作输入要素的百分比,还是要素的绝对数量。

  • PERCENTAGE_OF_INPUT子集大小将用作训练数据集中输入要素的百分比。
  • ABSOLUTE_VALUE子集大小将用作训练数据集中要素的数量。
Boolean

代码示例

SubsetFeatures 示例 1(Python 窗口)

将要素随机划分为两个要素类。

import arcpy
arcpy.management.SubsetFeatures("ca_ozone_pts", "C:/gapyexamples/output/training", 
                                "", "", "PERCENTAGE_OF_INPUT")
SubsetFeatures 示例 2(独立脚本)

将要素随机划分为两个要素类。

# Description: Randomly split the features into two feature classes.

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/dmpyexamples/data.gdb/data"

# Set local variables
inPointFeatures = "ca_ozone_pts.shp"
outtrainPoints = "C:/dmpyexamples/output.gdb/training"
outtestPoints = "C:/dmpyexamples/output.gdb/training"
subsetSize = 50
subsizeUnits = "PERCENTAGE_OF_INPUT"

# Run SubsetFeatures
arcpy.management.SubsetFeatures(inPointFeatures, outtrainPoints, outtestPoints, 
                                subsetSize, subsizeUnits)

许可信息

  • Basic: 是
  • Standard: 是
  • Advanced: 是

相关主题