110491: Размер выборки меньше, чем минимальное число объектов, необходимых для регрессии <значение>.

Описание

Указанное значение параметра Данные, доступные для одного дерева (%) приводит менее чем к шести значений данных для дерева. Для регрессии требуется не менее шести значений данных на одно дерево.

Решение

Увеличьте значение параметра Данные, доступные для одного дерева (%) так, чтобы для каждого дерева было как минимум шесть значений данных. Предполагается, что десять процентов входных объектов (с округлением в большую сторону) удерживаются для проверки. Умножьте число оставшихся объектов на процент данных для дерева (с округлением в меньшую сторону), чтобы узнать, сколько значений данных будет доступно для каждого дерева.

Например, у вас есть 105 объектов и 6% данных доступно для дерева. В этом случае предполагается, что 11 значений удерживаются для проверки (105 * 10/100 = 10.5, округляется до 11), оставляя 94 объекта доступными для обучения. У каждого дерева будет только пять значений данных, что меньше требуемого минимума, равного шести (94 * 6/100 = 5.64, округляется до 5).