标注 | 说明 | 数据类型 |
输入要素 | 将根据其创建子集的要素或表。 | Table View |
输出训练要素类 | 将创建的训练要素的子集。 | Feature Class; Table |
输出测试要素类 (可选) | 将创建的测试要素的子集。 | Feature Class; Table |
训练要素子集的大小 (可选) | 输出训练要素类的大小,以输入要素的百分比或者要素的绝对数量形式输入。 | Double |
子集大小单位 (可选) | 指定子集大小值将用作输入要素的百分比,还是要素的绝对数量。
| Boolean |
摘要
可将要素类或表的记录划分为两个子集:一个子集用作训练数据,另一个子集用作测试要素以比较和验证输出表面。
使用情况
-
在随机数生成器环境中,仅支持 Mersenne Twister 选项。 如果选择其他选项,则将使用 Mersenne Twister。
将数据集划分为训练要素和测试要素在插值、机器学习以及其他分析工作流中比较常见,这些工作流涉及根据数据来估计和构建模型。
如果使用多部分要素作为输入,则输出将为多部分要素的子集,而非单个要素。
参数
arcpy.management.SubsetFeatures(in_features, out_training_feature_class, {out_test_feature_class}, {size_of_training_dataset}, {subset_size_units})
名称 | 说明 | 数据类型 |
in_features | 将根据其创建子集的要素或表。 | Table View |
out_training_feature_class | 将创建的训练要素的子集。 | Feature Class; Table |
out_test_feature_class (可选) | 将创建的测试要素的子集。 | Feature Class; Table |
size_of_training_dataset (可选) | 输出训练要素类的大小,以输入要素的百分比或者要素的绝对数量形式输入。 | Double |
subset_size_units (可选) | 指定子集大小值将用作输入要素的百分比,还是要素的绝对数量。
| Boolean |
代码示例
将要素随机划分为两个要素类。
import arcpy
arcpy.management.SubsetFeatures("ca_ozone_pts", "C:/gapyexamples/output/training",
"", "", "PERCENTAGE_OF_INPUT")
将要素随机划分为两个要素类。
# Description: Randomly split the features into two feature classes.
# Import system modules
import arcpy
# Set environment settings
arcpy.env.workspace = "C:/dmpyexamples/data.gdb/data"
# Set local variables
inPointFeatures = "ca_ozone_pts.shp"
outtrainPoints = "C:/dmpyexamples/output.gdb/training"
outtestPoints = "C:/dmpyexamples/output.gdb/training"
subsetSize = 50
subsizeUnits = "PERCENTAGE_OF_INPUT"
# Run SubsetFeatures
arcpy.management.SubsetFeatures(inPointFeatures, outtrainPoints, outtestPoints,
subsetSize, subsizeUnits)
许可信息
- Basic: 是
- Standard: 是
- Advanced: 是