110490: Размер выборки меньше, чем минимальное число объектов, необходимых для классификации <значение>.

Описание

Указанное значение параметра Данные, доступные для одного дерева (%) приводит менее чем к двум значениям данных для дерева. Для классификации требуется не менее двух значений данных на одно дерево.

Решение

Увеличьте значение параметра Данные, доступные для одного дерева (%) так, чтобы для каждого дерева было как минимум два значения данных. Предполагается, что десять процентов входных объектов (с округлением в большую сторону) удерживаются для проверки. Умножьте число оставшихся объектов на процент данных для дерева (с округлением в меньшую сторону), чтобы узнать, сколько значений данных будет доступно для каждого дерева.

Например, у вас есть 105 объектов и 2% данных доступно для дерева. В этом случае предполагается, что 11 значений удерживаются для проверки (105 * 10/100 = 10.5, округляется до 11), оставляя 94 объекта доступными для обучения. У каждого дерева будет только одно значение данных, что меньше требуемого минимума в два значения на дерево (94 * 2/100 = 1.88, округляется до 1).