Поднабор пространственных объектов (Управление данными)

Краткая информация

Делит записи класса пространственных объектов или таблицы на два подмножества: одно подмножество для использования в качестве обучающих данных и одно подмножество для использования в качестве тестовых объектов для сравнения и проверки выходной поверхности.

Использование

  • В параметре среды Генератор случайных чисел поддерживается только опция Mersenne Twister. Если выбраны другие опции, вместо них будет использоваться Mersenne Twister.

  • Разделение набора данных на обучающие и тестовые объекты распространено в интерполяции, машинном обучении и других аналитических рабочих процессах, которые включают оценку и построение моделей на основе данных.

  • Если в качестве входных данных используются составные объекты, то на выходе будет получено подмножество составных объектов, а не отдельные объекты.

Параметры

ПодписьОписаниеТип данных
Входные объекты

Объекты или таблица, из которых будут созданы подмножества.

Table View
Выходной класс объектов обучения

Подмножество обучающих объектов, которые будут созданы.

Feature Class; Table
Выходной класс тестовых объектов
(Дополнительный)

Подмножество тестовых объектов, которые будут созданы.

Feature Class; Table
Размер подмножества объектов обучения
(Дополнительный)

Размер выходного обучающего класса объектов, задаваемый либо в процентах от входных объектов, либо в абсолютном количестве объектов.

Double
Единицы измерения размера подмножества
(Дополнительный)

Задает, будет ли использоваться значение размера подмножества в процентах от входных объектов или в виде абсолютного числа объектов.

  • Процент входных объектовРазмер подмножества будет задаваться в процентах от количества входных объектов, находящихся в обучающем наборе данных.
  • Абсолютное значениеРазмер подмножества будет задаваться как количество объектов, находящихся в обучающем наборе данных.
Boolean

arcpy.management.SubsetFeatures(in_features, out_training_feature_class, {out_test_feature_class}, {size_of_training_dataset}, {subset_size_units})
ИмяОписаниеТип данных
in_features

Объекты или таблица, из которых будут созданы подмножества.

Table View
out_training_feature_class

Подмножество обучающих объектов, которые будут созданы.

Feature Class; Table
out_test_feature_class
(Дополнительный)

Подмножество тестовых объектов, которые будут созданы.

Feature Class; Table
size_of_training_dataset
(Дополнительный)

Размер выходного обучающего класса объектов, задаваемый либо в процентах от входных объектов, либо в абсолютном количестве объектов.

Double
subset_size_units
(Дополнительный)

Задает, будет ли использоваться значение размера подмножества в процентах от входных объектов или в виде абсолютного числа объектов.

  • PERCENTAGE_OF_INPUTРазмер подмножества будет задаваться в процентах от количества входных объектов, находящихся в обучающем наборе данных.
  • ABSOLUTE_VALUEРазмер подмножества будет задаваться как количество объектов, находящихся в обучающем наборе данных.
Boolean

Пример кода

SubsetFeatures, пример 1 (окно Python)

Случайным образом разделяет объекты на два класса объектов.

import arcpy
arcpy.management.SubsetFeatures("ca_ozone_pts", "C:/gapyexamples/output/training", 
                                "", "", "PERCENTAGE_OF_INPUT")
SubsetFeatures, пример 2 (автономный скрипт)

Случайным образом разделяет объекты на два класса объектов.

# Description: Randomly split the features into two feature classes.

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/dmpyexamples/data.gdb/data"

# Set local variables
inPointFeatures = "ca_ozone_pts.shp"
outtrainPoints = "C:/dmpyexamples/output.gdb/training"
outtestPoints = "C:/dmpyexamples/output.gdb/training"
subsetSize = 50
subsizeUnits = "PERCENTAGE_OF_INPUT"

# Run SubsetFeatures
arcpy.management.SubsetFeatures(inPointFeatures, outtrainPoints, outtestPoints, 
                                subsetSize, subsizeUnits)

Информация о лицензиях

  • Basic: Да
  • Standard: Да
  • Advanced: Да

Связанные разделы