| Подпись | Описание | Тип данных |
Объекты результата анализа | Класс объектов, содержащий выходные результаты обучения из инструментов Классификация на основе леса, Классификация с бустингом и регрессия, Обобщенная линейная регрессия или Прогнозирование только присутствия. Результаты обучения прогнозирования будут оценены при помощи перекрестной проверки. | Feature Layer |
Выходные объекты | Выходные объекты будут содержать исходные независимые переменные, зависимые переменные и дополнительные поля, суммирующие результаты перекрестной проверки. | Feature Class |
Выходная таблица проверок | Выходная таблица будет содержать показатели оценки для каждого запуска проверки. | Table |
Входные объекты анализа | Входные объекты, которые будут использоваться в анализе, создавшем итоговые объекты анализа. | Feature Layer |
Тип оценки (Дополнительный) | Задает метод, который используется для разбиения значения параметра Объекты результата анализа на k групп.
| String |
Число групп (Дополнительный) | Число групп, на которое будет разбито значение параметра Объекты результата анализа. Число групп должно быть больше 1. Значение по умолчанию равно 10. | Long |
Тип балансировки (Дополнительный) | Указывает метод, который будет использоваться для балансировки числа выборок каждой категории зависимой переменной в обучающей группе. Этот параметр активен, если исходная модель прогнозировала категориальную переменную.
| String |
Краткая информация
Оценивает производительность модели прогнозирования при помощи перекрестной проверки. Этот инструмент вычисляет показатели проверки для моделей, созданных при помощи инструментов Классификация на основе леса, Классификация с бустингом и регрессия, Обобщенная линейная регрессия и Прогнозирование только присутствия. Он позволяет указать тип оценки (например, K-кратное или пространственное K-кратное распределение), число групп и балансировку редких событий для обеспечения надежной и непредвзятой оценки модели.
Изучите, как работает Оценка прогнозов перекрестной проверкой
Иллюстрация

Использование
Параметр Тип оценки содержит следующие опции для разбиения объектов по группам:
- Пространственное k-кратное распределение — Используйте пространственную перекрестную проверку для оценки того, как модель выполняет прогноз объектов, географически находящихся вне изучаемой области обучающих данных.
- Произвольное k-кратное распределение — Используйте произвольную перекрестную проверку для оценки того, как модель выполняет прогноз объектов, географически находящихся в изучаемой области обучающих данных
При использовании классификации для прогнозирования редких событий или несбалансированных категорий, применяйте параметр Тип балансировки, чтобы сбалансировать число выборок в пределах каждого категориального уровня. Протестируйте различные методы балансировки в этом инструменте, затем выберите наилучший метод и запустите его на полном обучающем наборе данных до прогнозирования, используя инструмент Подготовка данных для прогноза.
Перекрестная проверка не используется для создания одной модели или файла модели. Она создает показатели точности, которые можно использовать для оценки того, насколько хорошо модель и ее параметры прогнозируют данные, исключенные при обучении модели.
Этот инструмент не будет принимать объекты анализа, которые были сначала подвергнуты избыточной выборке в инструменте Подготовка данных для прогноза, то есть сбалансированы с использованием произвольной избыточной выборки или SMOTE. Данные с избыточной выборкой не могут быть использованы в наборе для проверки из-за утечки данных.
Учитываются параметры в исходном инструменте прогнозирования. Однако для результатов анализа, выполненного при помощи инструмента Классификация на основе леса и регрессия, регрессия с бустингом, данные проверки задаются как 0. Если параметр Оптимизация параметров использовался с инструментом Классификация на основе леса и регрессия, регрессия с бустингом, оптимальные параметры из запуска исходного инструмента будут применены при выполнении перекрестной проверки.
Инструмент создает следующие выходные данные:
- Выходные пространственные объекты — записываются обучающий набор данных и результаты обучения и прогнозирования каждого объекта в обучающем наборе данных.
- Выходная таблица проверки — записываются показатели оценки для каждого запуска проверки.
Параметры
arcpy.stats.CrossValidate(analysis_result_features, out_features, out_table, analysis_input_features, {evaluation_type}, {num_groups}, {balancing_type})| Имя | Описание | Тип данных |
analysis_result_features | Класс объектов, содержащий выходные результаты обучения из инструментов Классификация на основе леса, Классификация с бустингом и регрессия, Обобщенная линейная регрессия или Прогнозирование только присутствия. Результаты обучения прогнозирования будут оценены при помощи перекрестной проверки. | Feature Layer |
out_features | Выходные объекты будут содержать исходные независимые переменные, зависимые переменные и дополнительные поля, суммирующие результаты перекрестной проверки. | Feature Class |
out_table | Выходная таблица будет содержать показатели оценки для каждого запуска проверки. | Table |
analysis_input_features | Входные объекты, которые будут использоваться в анализе, создавшем итоговые объекты анализа. | Feature Layer |
evaluation_type (Дополнительный) | Задает метод, который используется для разбиения значения параметра analysis_result_features на k групп.
| String |
num_groups (Дополнительный) | Число групп, на которое будет разбито значение параметра analysis_result_features. Число групп должно быть больше 1. Значение по умолчанию равно 10. | Long |
balancing_type (Дополнительный) | Указывает метод, который будет использоваться для балансировки числа выборок каждой категории зависимой переменной в обучающей группе. Этот параметр активен, если исходная модель прогнозировала категориальную переменную.
| String |
Пример кода
Скрипт окна Python, демонстрирующий использование функции CrossValidate.
# Evaluate a predictive model with cross validation
import arcpy
arcpy.env.workspace = r"c:\data\project_data.gdb"
arcpy.stats.CrossValidate(
analysis_result_features=r"in_analysis_result_features",
out_features=r"out_feature",
out_table=r"out_table",
analysis_input_features=r"analyis_in_feature",
evaluation_type="RANDOM_KFOLD",
num_groups=10,
balancing_type="NONE"
)В следующем автономном скрипте показано использование функции CrossValidate.
# Evaluate a predictive model with cross validation
import arcpy
# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"
# Run tool
arcpy.stats.CrossValidate(
analysis_result_features=r"in_analysis_result_features",
out_features=r"out_feature",
out_table=r"out_table",
analysis_input_features=r"analyis_in_feature",
evaluation_type="RANDOM_KFOLD",
num_groups=10,
balancing_type="NONE"
)Параметры среды
Информация о лицензиях
- Basic: Ограниченные
- Standard: Ограниченные
- Advanced: Ограниченные
Связанные разделы
- Обзор группы инструментов Моделирование пространственных отношений
- Подготовка данных для прогноза
- Классификация на основе леса и регрессия, регрессия с бустингом
- Обобщенная линейная регрессия
- Прогнозирование только присутствия (MaxEnt)
- Как работает Оценка прогнозов Перекрестной проверкой
- Как работает Подготовка данных для прогноза