Аргументы глубокого обучения—ArcGIS Pro

Доступно с лицензией Image Analyst.

Аргументы - один из вариантов управления способов обучения и использования моделей глубокого обучения. В данном разделе в первой таблице перечислены поддерживаемые аргументы модели для обучения моделей глубокого обучения. Во второй таблице перечислены аргументы, контролирующие, как модели глубокого обучения используются для вывода.

Обучающие аргументы

Инструмент Тренировать модель глубокого обучения включает аргументы для обучения моделей глубокого обучения. Аргументы различаются в зависимости от архитектуры модели. Вы можете менять значения этих аргументов для обучения моделей. Аргументы следующие:

attention_type — Определяет тип модуля. По умолчанию – PAM.
attn_res — Количество рассмотрений в остаточных блоках. Это необязательное целочисленное значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. По умолчанию это 16
backend — Определяет внутреннюю среду, которая будет использоваться для этой модели. Чтобы использовать Tensorflow, переключитесь на тип процессора CPU. По умолчанию – pytorch.
bias — Смещение для головного элемента Single Shot Detector (SSD). Значение по умолчанию -0,4.
box_batch_size_per_image — Количество предложений, которые выбираются во время обучения классификации. Значение по умолчанию 512.
box_bg_iou_thresh — Максимальное пересечение объединения (IoU) между предложениями и (истинным) блоком GT, чтобы их можно было считать отрицательными во время обучения головного элемента классификации. Значение по умолчанию равно 0.5.
box_detections_per_img — Максимальное количество обнаружений на изображение для всех классов. По умолчанию используется 100.
box_fg_iou_thresh — Минимальный IoU между предложениями и блоком GT, чтобы их можно было считать положительными во время обучения головного элемента классификации. Значение по умолчанию равно 0.5.
box_nms_thresh — Порог немаксимального подавления (NMS) для головного элемента прогнозирования, используемого во время вывода. Значение по умолчанию равно 0.5.
box_positive_fraction — Доля положительных предложений в мини-пакете во время обучения головного элемента классификации. По умолчанию – 0,25.
box_score_thresh — Порог оценки классификации, который должен быть достигнут для возврата предложений во время вывода. Значение по умолчанию 0,05.
channel_mults — Дополнительные множители глубины для последующих разрешений в U-Net. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. По умолчанию это 1, 2, 4, 4, 8, 8.
channels_of_interest — Список интересующих спектральных диапазонов (каналов). Фильтрует каналы растров разновременных временных рядов на основе этого списка. Например, если в наборе данных есть каналы 0–4, а обучение будет использовать только каналы 0,1 и 2, список будет [0,1,2].
chip_size — Размер изображения, которое будет использоваться для обучения модели. Изображения будут обрезаны до указанного размера чипа.
class_balancing — Указывает, будет ли обратная кросс-энтропийная потеря сбалансирована с частотой пикселов на класс. По умолчанию – False.
d_k — Измерение векторов ключа и запроса. Значение по умолчанию 32.
decode_params — Словарь, который определяет, как будет работать Image captioner. Он состоит из следующих параметров: embed_size, hidden_size, attention_size, teacher_forcing, dropout и pretrained_emb. Параметр teacher_forcing — это вероятность усиления учителем. Teacher forcing — это стратегия обучения рекуррентных нейронных сетей. Она использует выходные данные модели из предыдущего временного шага в качестве входных данных вместо предыдущих выходных данных во время обратной передачи ошибки обучения. Параметр pretrained_emb указывает, будет ли использоваться предварительно обученное встраивание текста. Если True, будет использоваться быстрое встраивание текста. Если False, предварительно обученное встраивание текста не будет использоваться.
depth — Глубина модели. По умолчанию 17.
depths — Количество блоков на каждом этапе. По умолчанию [3, 3, 9, 3].
dice_loss_average — Указывает, будет ли использоваться микроусреднение или макроусреднение. Макроусреднение вычислит показатель независимо для каждого класса и возьмет среднее, обрабатывая все классы одинаково. Микроусреднение объединит вклады всех классов для вычисления среднего показателя. В настройке многоклассовой классификации микроусреднение предпочтительнее, если возможен дисбаланс классов, при котором образцов одного класса намного больше, чем образцов других классов. По умолчанию - микроусреднение.
dice_loss_fraction - вес потерь по умолчанию (или фокусных потерь) по сравнению с разделенными потерями в общих потерях для управления обучением. По умолчанию - 0. Если focal_loss задано как true, вместо потерь по умолчанию используются фокусные потери. Если dice_loss_fraction задано как 0, обучение будет использовать значение потерь по умолчанию (либо фокальную потерю) в качестве общей потери для управления обучением. Если значение dice_loss fraction больше 0, то при обучении будет использоваться следующая формула для расчета общих потерь:
```
=(1 – dice_loss_fraction)*default_loss + dice_loss_fraction*dice_loss
```
dims — Размерность объекта на каждом этапе. По умолчанию [96, 192, 384, 768].
downsample_factor - фактор, который будет использоваться для понижения разрешения изображений. Значение по умолчанию равно 4.
drop — Вероятность прореживания. Чтобы снизить переобучение, увеличьте это значение. По умолчанию 0,3.
dropout — Вероятность прореживания. Чтобы снизить переобучение, увеличьте это значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию зависит от значения параметра Тип модели.
drop_path_rate — Уровень стохастической глубины. Значение по умолчанию равно 0,0.
embed_dim — Измерение вставок. По умолчанию 768.
feat_loss — Указывает, будет ли использована дискриминаторная потеря сопоставления объектов. По умолчанию – True.
focal_loss — Указывает, будут ли использоваться фокальные потери. Фокальные потери могут решить проблему несбалансированности классов в однопроходной модели обнаружения объектов. По умолчанию – False.
gaussian_thresh — порог Гаусса, который задает требуемую ширину дороги. Допустимый диапазон от 0.0 до 1.0. По умолчанию 0.76.
gen_blocks — Количество блоков ResNet для использования в генераторе. По умолчанию 9.
gen_network — Указывает модель, которая будет использоваться для генератора. Используйте global, если мало памяти графического процессора. По умолчанию - local.
grids — Количество сеток, на которые будет разбито изображение для обработки. Например, значение аргумента равным 4 означает, что изображение будет разделено на 16 ячеек (4 x 4). Если значение не задано, оптимальное значение сетки будет рассчитано на основе входных изображений.
head_init_scale — Начальное значение масштаба для весов и смещений классификатора. По умолчанию 1.0.
ignore_classes – Список значений классов, при которых в модели не будет потерь.
inner_channel – Измерение первого слоя U-net. Это необязательное целочисленное значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию - 64.
keep_dilation — Указывает, будет ли использоваться растяжение. Установка значения True и использование архитектуры pointrend может потенциально улучшить точность за счет потребления памяти. По умолчанию – False.
lambda_feat — Вес потерь сопоставления объектов. Значение по умолчанию равно 10.
lambda_l1 — Вес потерь сопоставления объектов. Не поддерживается для 3-канальных изображений. По умолчанию используется 100.
layer_scale_init_value — Начальное значение масштаба слоя. Значение по умолчанию - 1e-6.
linear_end — Необязательное целое число для планирования окончания. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию 1e-06.
linear_start — Необязательное целое число для планирования запуска. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию 1e-02.
lsgan — Указывает, будет ли использоваться среднеквадратичная ошибка в обучении. Если задано False, будет использоваться двоичная перекрестная энтропия. По умолчанию – True.
location_loss_factor — Вес потерь ограничивающего прямоугольника. Этот фактор регулирует фокус модели на местоположении ограничивающего прямоугольника. Если задано значение None, вес потерь местоположения и потерь классификации будет одинаковым.
min_points — Количество пикселов, которые будут выбраны из каждой маскированной области обучения. Это значение должно быть кратно 64.
mixup — Указывает, будут ли создаваться новые обучающие изображения путем случайного смешивания обучающих изображений (True). По умолчанию – False.
mlp_ratio — Соотношение многослойного персептрона (MLP). Значение по умолчанию равно 4.
mlp1 — Измерения последовательных пространств объектов MLP1. По умолчанию - это 32,64.
mlp2 — Размеры последовательных пространств объектов MLP2. По умолчанию - это 128,128.
mlp4 — Размеры декодера MLP. По умолчанию - это 64,32.
model — Опорная модель, которая будет использоваться для обучения модели. Доступные опорные модели зависят от значения параметра Тип модели. Этот аргумент поддерживается только для типов модели MMDetection и MMSegmentation. Значение по умолчанию для MMDetection — cascade_rcnn. Значение по умолчанию для MMSegmentation — mask2former.
model_weight — Определяет, использовать ли веса предварительно обученной модели. Значением также может быть путь к файлу конфигурации, содержащему веса модели из репозитория MMDetection или репозитория MMSegmentation. По умолчанию – False.
monitor — Указывает, какая метрика будет отслеживаться при проверке и ранней остановке. Доступные метрики зависят от значения параметра Тип модели. По умолчанию – valid_loss.
mtl_model — Задает тип архитектуры, который будет использоваться для создания модели. Возможные варианты linknet или hourglass для нейронных архитектур на основе linknet или hourglass соответственно. По умолчанию hourglass.
n_blocks_global — Количество остаточных блоков в глобальной сети генератора. По умолчанию 9.
n_blocks_local — Количество остаточных блоков в локальной сети усилителя. Значение по умолчанию равно 3.
n_downsample_global — Количество слоев понижения частоты дискретизации в глобальной сети генератора.
n_dscr — Количество используемых дискриминаторов. Значение по умолчанию равно 2.
n_dscr_filters — Количество фильтров дискриминатора в первом уровне свертки. Значение по умолчанию - 64.
n_gen_filters — Количество фильтров gen в первом уровне свертки. Значение по умолчанию - 64.
n_head — Количество заголовков прерывания. Значение по умолчанию равно 4.
n_layers_dscr — Количество слоев для сети дискриминатора, используемой в Pix2PixHD. Значение по умолчанию равно 3.
n_local_enhancers — Количество используемых локальных усилителей. Значение по умолчанию равно 1.
n_masks — Максимальное количество надписей классов и экземпляров, которые может содержать любое изображение. Значение по умолчанию равно 30.
n_timestep — Количество временных шагов диффузии. Это необязательное значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию равно 1000.
norm — Указывает, будет ли использована нормализация экземпляров или пакетная нормализация. По умолчанию - нормализация экземпляров.
norm_groups — Количество групп для нормирования групп. Это необязательное целочисленное значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию 32.
num_heads — Количество заголовков прерывания. Значение по умолчанию равно 12.
orient_bin_size — Размер бина для углов ориентации. Значение по умолчанию равно 20.
orient_theta — Ширина маски ориентации. Значение по умолчанию - 8.
oversample — Указывает, будет ли использована избыточная выборка. Если задано значение True, несбалансированные классы набора данных будут подвергаться избыточной выборке во время обучения. Это не поддерживается с наборами данных MultiLabel. По умолчанию – False.
patch_size — размер патча для генерации внедрений патча. Значение по умолчанию 16.
perceptual_loss — Указывает, будет ли использоваться перцептуальная потеря в обучении. По умолчанию – False.
pointrend — Указывает, будет ли использоваться архитектура PointRend поверх заголовка сегментации. Для получения дополнительной информации об архитектуре PointRend см. PointRend PDF. По умолчанию – False.
pooling — Стратегия объединения пикселов с внедрением, которая будет использоваться. По умолчанию - mean.
pyramid_sizes — Количество и размер слоев свертки, которые будут применяться к различным подобластям. Аргумент относится к модели Pyramid Scene Parsing Network. По умолчанию [1,2,3,6].
qkv_bias — Указывает, будет ли использоваться смещение вектора QK в обучении. По умолчанию – False.
ratios — Список пропорций, которые будут использоваться для рамок якоря. При обнаружении объекта рамка привязки представляет идеальное местоположение, форму и размер прогнозируемого объекта. Например, задание для этого аргумента [1.0,1.0], [1.0, 0.5] означает, что рамка якоря - это квадрат (1:1) или прямоугольник, горизонтальная сторона которого в два раза меньше вертикальной (1:0.5). По умолчанию для RetinaNet – [0.5,1,2]. По умолчанию для Single Shot Detector – [1.0, 1.0].
res_blocks — Количество остаточных блоков. Это необязательное целочисленное значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию равно 3.
rpn_batch_size_per_image — Количество якорей, которые выбираются во время обучения RPN для вычисления потерь. Значение по умолчанию 256.
rpn_bg_iou_thresh — Максимальный IoU между якорем и блоком GT, чтобы их можно было считать отрицательными во время обучения RPN. По умолчанию 0,3.
rpn_fg_iou_thresh — Минимальный IoU между якорем и блоком GT, чтобы их можно было считать положительными во время обучения RPN. Значение по умолчанию 0,7.
rpn_nms_thresh — Порог NMS, который будет использоваться для постобработки предложений RPN. Значение по умолчанию 0,7.
rpn_positive_fraction — Доля положительных якорей в мини-пакете во время обучения RPN. Значение по умолчанию равно 0.5.
rpn_post_nms_top_n_test — Количество предложений, которые будут сохранены после применения NMS во время тестирования. Значение по умолчанию равно 1000.
rpn_post_nms_top_n_train — Количество предложений, которые будут сохранены после применения NMS во время обучения. Значение по умолчанию равно 2000.
rpn_pre_nms_top_n_test — Количество предложений, которые будут сохранены перед применением NMS во время тестирования. Значение по умолчанию равно 1000.
rpn_pre_nms_top_n_train — Количество предложений, которые будут сохранены перед применением NMS во время обучения. Значение по умолчанию равно 2000.
scales — Количество уровней масштабирования, на которые каждая ячейка будет увеличена или уменьшена. По умолчанию [1, 0.8, 0.63].
schedule — Тип расписания, который будет использоваться. Это необязательное значение. Варианты: linear, warmup10, warmup50, const, jsd и cosine. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значением по умолчанию является Линейная.
T — Период, который будет использоваться для позиционного кодирования. Значение по умолчанию равно 1000.
timesteps_of_interest — Список интересующих временных шагов; это отфильтрует разновременные временные ряды на основе списка указанных временных шагов. Например, если набор данных имеет временные шаги 0, 1, 2 и 3, но в обучении используются только временные шаги 0, 1 и 2, этот параметр будет задан как [0,1,2]; остальные временные шаги будут отфильтрованы.
use_net – Задает, будет ли использоваться декодер U-Net для восстановления данных после завершения формирования пирамидного пула. Аргумент относится к модели Pyramid Scene Parsing Network. По умолчанию – True.
vgg_loss — Указывает, будет ли использована потеря соответствия объектов VGG. Поддерживается только для 3-канальных изображений. По умолчанию – True.
zooms — Количество уровней масштабирования, на которое каждая ячейка сетки будет увеличена или уменьшена. Установка для этого аргумента значения 1 означает, что все ячейки сетки останутся в том же размере или уровне масштабирования. Уровень масштабирования 2 означает, что все ячейки сетки станут в два раза больше (увеличены на 100 процентов). Предоставление списка уровней масштабирования означает, что все ячейки сетки будут масштабироваться с использованием всех значений в списке. Значение по умолчанию равно 1.


Тип модели	Аргумент	Корректные значения
3D-RCNet (классификация пикселов)	depths	Список положительных целых чисел. По умолчанию [3, 3, 9, 3].
	dims	Список положительных целых чисел. По умолчанию [96, 192, 384, 768].
	drop_path_rate	Значения с плавающей запятой. Значение по умолчанию равно 0,0.
	head_init_scale	Значения с плавающей запятой. По умолчанию 1.0.
	layer_scale_init_value	Значения с плавающей запятой. Значение по умолчанию - 1e-6.
Изменить детектор (классификация пикселов)	attention_type	PAM (Pyramid Attention Module) или BAM (Basic Attention Module). По умолчанию – PAM.
	chip_size	Целые числа от 0 до размера изображения.
	monitor	valid_loss, precision, recall и f1. По умолчанию – valid_loss.
ConnectNet (классификация пикселов)	chip_size	Целые числа от 0 до размера изображения.
	gaussian_thresh	0.0 до 1.0. По умолчанию 0.76.
	monitor	valid_loss, accuracy, miou и dice. По умолчанию – valid_loss.
	mtl_model	linknet или hourglass. По умолчанию – hourglass.
	orient_bin_size	Положительное число. Значение по умолчанию равно 20.
	orient_theta	Положительное число. Значение по умолчанию - 8.
CycleGAN (преобразование изображения)	gen_blocks	Положительное целое число. По умолчанию 9.
CycleGAN (преобразование изображения)	lsgan	true или false. По умолчанию – true.
DeepLabv (классификация пикселов)	chip_size	Целые числа от 0 до размера изображения.
	class_balancing	true или false. По умолчанию – false.
	dice_loss_average	micro или macro. По умолчанию – micro.
	dice_loss_fraction	Значение с плавающей точкой от 0 до 1. По умолчанию - 0.
	focal_loss	true или false. По умолчанию – false.
	ignore_classes	Допустимые значения классов.
	keep_dilation	true или false. По умолчанию – false.
	mixup	true или false. По умолчанию – false.
	monitor	valid_loss и accuracy. По умолчанию – valid_loss.
	pointrend	true или false. По умолчанию – false.
FasterRCNN (Выявление объектов)	box_batch_size_per_image	Положительные целые числа. Значение по умолчанию 512.
	box_bg_iou_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.
	box_detections_per_img	Положительные целые числа. По умолчанию используется 100.
	box_fg_iou_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.
	box_nms_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.
	box_positive_fraction	Значение с плавающей точкой от 0 до 1. По умолчанию – 0,25.
	box_score_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,05.
	rpn_batch_size_per_image	Положительные целые числа. Значение по умолчанию 256.
	rpn_bg_iou_thresh	Значение с плавающей точкой от 0 до 1. По умолчанию 0,3.
	rpn_fg_iou_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.
	rpn_nms_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.
	rpn_positive_fraction	Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.
	rpn_post_nms_top_n_test	Положительные целые числа. Значение по умолчанию равно 1000.
	rpn_post_nms_top_n_train	Положительные целые числа. Значение по умолчанию равно 2000.
	rpn_pre_nms_top_n_test	Положительные целые числа. Значение по умолчанию равно 1000.
	rpn_pre_nms_top_n_train	Положительные целые числа. Значение по умолчанию равно 2000.
Feature Classifier (Классификация объектов)	backend	pytorch или tensorflow. По умолчанию – pytorch.
	mixup	true или false. По умолчанию – false.
	oversample	true или false. По умолчанию – false.
Image captioner (преобразование изображения)	chip_size	Целые числа от 0 до размера изображения.
	Аргумент decode_params состоит из следующих шести параметров: embed_size hidden_size attention_size teacher_forcing dropout pretrained_emb	По умолчанию – {'embed_size':100, 'hidden_size':100, 'attention_size':100, 'teacher_forcing':1, 'dropout':0.1, 'pretrained_emb':False}.
	monitor	valid_loss, accuracy, corpus_bleu и multi_label_fbeta. По умолчанию – valid_loss.
MaskRCNN (Выявление объектов)	box_batch_size_per_image	Положительные целые числа. Значение по умолчанию 512.
	box_bg_iou_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.
	box_detections_per_img	Положительные целые числа. По умолчанию используется 100.
	box_fg_iou_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.
	box_nms_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.
	box_positive_fraction	Значение с плавающей точкой от 0 до 1. По умолчанию – 0,25.
	box_score_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,05.
	rpn_batch_size_per_image	Положительные целые числа. Значение по умолчанию 256.
	rpn_bg_iou_thresh	Значение с плавающей точкой от 0 до 1. По умолчанию 0,3.
	rpn_fg_iou_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.
	rpn_nms_thresh	Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.
	rpn_positive_fraction	Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.
	rpn_post_nms_top_n_test	Положительные целые числа. Значение по умолчанию равно 1000.
	rpn_post_nms_top_n_train	Положительные целые числа. Значение по умолчанию равно 2000.
	rpn_pre_nms_top_n_test	Положительные целые числа. Значение по умолчанию равно 1000.
	rpn_pre_nms_top_n_train	Положительные целые числа. Значение по умолчанию равно 2000.
MaXDeepLab (общая сегментация)	n_masks	Положительные целые числа. Значение по умолчанию равно 30.
MMDetection (выявление объектов)	chip_size	Целые числа от 0 до размера изображения.
	model	atss, carafe, cascade_rcnn, cascade_rpn, dcn, deeplabv3, detectors, dino, double_heads, dynamic_rcnn, empirical_attention, fcos, foveabox, fsaf, ghm, hrnet, libra_rcnn, nas_fcos, pafpn, pisa, regnet, reppoints, res2net, sabl и vfnet. По умолчанию – deeplabv3.
	model_weight	true или false.
MMSegmentation (классификация пикселов)	chip_size	Целые числа от 0 до размера изображения.
	model	ann, apcnet, ccnet, cgnet, deeplabv3, deeplabv3plus, dmnet , dnlnet, emanet, fastscnn, fcn, gcnet, hrnet, mask2former, mobilenet_v2, nonlocal_net, ocrnet, prithvi100m, psanet, pspnet, resnest, sem_fpn, unet и upernet. По умолчанию – mask2former.
	model_weight	true или false. По умолчанию – false.
Multi Task Road Extractor (классификация пикселов)	chip_size	Целые числа от 0 до размера изображения.
	gaussian_thresh	0.0 до 1.0. По умолчанию 0.76.
	monitor	valid_loss, accuracy, miou и dice. По умолчанию – valid_loss.
	mtl_model	linknet или hourglass. По умолчанию – hourglass.
	orient_bin_size	Положительное число. Значение по умолчанию равно 20.
	orient_theta	Положительное число. Значение по умолчанию - 8.
Pix2Pix (преобразование изображения)	perceptual_loss	true или false. По умолчанию – false.
Pix2PixHD (преобразование изображения)	feat_loss	true или false. По умолчанию – true.
	gen_network	local или global. По умолчанию – local.
	lambda_feat	Положительные целые значения. Значение по умолчанию равно 10.
	lambda_l1	Положительные целые значения. По умолчанию используется 100.
	lsgan	true или false. По умолчанию – true.
	n_blocks_global	Положительные целые значения. По умолчанию 9.
	n_blocks_local	Положительные целые значения. Значение по умолчанию равно 3.
	n_downsample_global	Положительные целые значения. Значение по умолчанию равно 4.
	n_dscr	Положительные целые значения. Значение по умолчанию равно 2.
	n_dscr_filters	Положительные целые значения. Значение по умолчанию - 64.
	n_gen_filters	Положительные целые значения. Значение по умолчанию - 64.
	n_layers_dscr	Положительные целые значения. Значение по умолчанию равно 3.
	n_local_enhancers	Положительные целые значения. Значение по умолчанию равно 1.
	norm	instance или batch. По умолчанию – instance.
	vgg_loss	true или false. По умолчанию – true.
PSETAE (классификация пикселов)	channels_of_interest	Список номеров каналов (положительные целые значения).
	d_k	Положительные целые значения. Значение по умолчанию 32.
	dropout	Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,2.
	min_points	Целые числа, кратные 64.
	mlp1	Список положительных целых чисел. По умолчанию - это 32,64.
	mlp2	Список положительных целых чисел. По умолчанию - это 128,128.
	mlp4	Список положительных целых чисел. По умолчанию - это 64,32.
	n_head	Положительные целые значения. Значение по умолчанию равно 4.
	pooling	mean, std, max или min. По умолчанию – mean.
	T	Положительные целые значения. Значение по умолчанию равно 1000.
	timesteps_of_interest	Список положительных целых чисел.
Pyramid Scene Parsing Network (классификация пикселов)	chip_size	Целые числа от 0 до размера изображения.
	class_balancing	true или false. По умолчанию – false.
	dice_loss_average	micro или macro. По умолчанию – micro.
	dice_loss_fraction	Значение с плавающей точкой от 0 до 1. По умолчанию - 0.
	focal_loss	true или false. По умолчанию – false.
	ignore_classes	Допустимые значения классов.
	keep_dilation	true или false. По умолчанию – false.
	mixup	true или false. По умолчанию – false.
	monitor	valid_loss или accuracy. По умолчанию – valid_loss.
	pointrend	true или false. По умолчанию – false.
	pyramid_sizes	[уровень свертки 1, уровень свертки 2, ... , уровень свертки n]
	use_net	true или false. По умолчанию – true.
RetinaNet (выявление объектов)	chip_size	Целые числа от 0 до размера изображения.
	monitor	valid_loss или average_precision. По умолчанию – valid_loss.
	ratios	Значение отношения 1, значение отношения 2, значение отношения 3. По умолчанию 0.5,1,2.
	scales	[значение шкалы 1, значение шкалы 2, значение шкалы 3] По умолчанию [1, 0.8, 0.63].
SAMLoRA (классификация пикселов)	class_balancing	true или false. По умолчанию – false.
SAMLoRA (классификация пикселов)	ignore_classes	Допустимые значения классов.
Single Shot Detector (выявление объектов)	backend	pytorch или tensorflow. По умолчанию – pytorch.
	bias	Значение с плавающей точкой. Значение по умолчанию -0,4.
	chip_size	Целые числа от 0 до размера изображения. По умолчанию 0,3.
	drop	Значение с плавающей точкой от 0 до 1.
	focal_loss	true или false. По умолчанию – false.
	grids	Целочисленные значения больше 0.
	location_loss_factor	Значение с плавающей точкой от 0 до 1.
	monitor	valid_loss или average_precision. По умолчанию – valid_loss.
	ratios	[значение по горизонтали, значение по вертикали]
	zooms	Значение увеличения, где 1.0 - отсутствие увеличения.
Super-resolution с опорной моделью SR3 (преобразование изображения)	attn_res	Целочисленные значения больше 0. По умолчанию это 16.
	channel_mults	Наборы целочисленных множителей. По умолчанию это [1, 2, 4, 4, 8, 8].
	downsample_factor	Положительные целые значения. Значение по умолчанию равно 4.
	dropout	Значение с плавающей точкой. По умолчанию - 0.
	inner_channel	Целочисленное значение больше 0. Значение по умолчанию - 64.
	linear_start	Целочисленное значение времени. Значение по умолчанию 1e-02.
	linear_end	Целочисленное значение времени. Значение по умолчанию 1e-06.
	n_timestep	Целочисленное значение больше 0. Значение по умолчанию равно 1000.
	norm_groups	Целочисленное значение больше 0. Значение по умолчанию 32.
	res_blocks	Целочисленное значение больше 0. Значение по умолчанию равно 3.
	schedule	linear, warmup10, warmup50, const, jsd, или cosine. По умолчанию – linear.
Суперразрешение с опорной моделью SR3_UViT (преобразование изображения)	depth	Положительное целое числовое значение. По умолчанию 17.
	embed_dim	Положительное целое числовое значение. По умолчанию 768.
	mlp_ratio	Положительное значение с плавающей запятой. По умолчанию 4,0.
	num_heads	Положительное целое числовое значение. Значение по умолчанию равно 12.
	patch_size	Положительное целое числовое значение. По умолчанию это 16.
	qkv_bias	true или false. По умолчанию – false.
U-Net (классификация пикселов)	chip_size	Целые числа от 0 до размера изображения.
	class_balancing	true или false. По умолчанию – false.
	dice_loss_average	micro или macro. По умолчанию – micro.
	dice_loss_fraction	Значение с плавающей точкой от 0 до 1. По умолчанию - 0.
	focal_loss	true или false. По умолчанию – false.
	ignore_classes	Допустимые значения классов.
	mixup	true или false. По умолчанию – false.
	monitor	valid_loss или accuracy. По умолчанию - valid_loss.

Выводящие аргументы

Следующие аргументы доступны для, контроля, как обучаются модели глубокого обучения для вывода. Информация из параметра Определение модели используется для заполнения параметра Аргументы в инструментах вывода. Аргументы различаются в зависимости от архитектуры модели. Предварительно обученные модели ArcGIS и пользовательские модели глубокого обучения могут включать дополнительные аргументы, которые поддерживаются инструментом.


Аргумент		Тип вывода	Корректные значения
batch_size	Количество листов изображений, которые будут обработаны на каждом этапе построения модели. Оно зависит от объема памяти вашего графического адаптера. Аргумент доступен для всех архитектур моделей.	Классифицировать объекты Классифицировать пикселы Выявить изменения Выявить объекты	Целочисленные значения больше 0; обычно целое число в степени 2ⁿ.
direction	Направление, в котором изображение передается из одного домена в другой. Более подробную информацию об этом аргументе см. в Как работает CycleGAN. Аргумент доступен только для архитектуры CycleGAN.	Классифицировать пикселы	Доступными опциями являются AtoB и BtoA.
exclude_pad_detections	Указывает, будут ли фильтроваться усеченные обнаружения вблизи краев, которые находятся в дополненной области фрагментов изображений. Аргумент доступен только для SSD, RetinaNet, YOLOv3, DETReg, MMDetection и Faster RCNN.	Выявить объекты	true или false.
merge_policy	Политика, которая будет использоваться для объединения расширенных прогнозов. Это применимо только при использовании увеличения времени тестирования. Для инструмента Классифицировать пикселы при помощи глубокого обучения аргумент доступен в арххитектурах MultiTaskRoadExtractor и ConnectNet. Если IsEdgeDetection присутствует в файле .emd модели, BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation также являются доступными архитектурами. Для инструмента Выявить объекты при помощи глубокого обучения аргумент доступен только для MaskRCNN.	Классифицировать пикселы Выявить объекты	Доступные опции mean, max и min.
nms_overlap	Коэффициент максимального перекрытия для двух перекрывающихся объектов, который определяется как отношение площади пересечения к площади объединения. Аргумент доступен для всех архитектур моделей.	Выявить объекты	Значение с плавающей точкой от 0.0 до 1.0. Значение по умолчанию равно 0.1.
output_classified_raster	Путь к выходному растру. Аргумент доступен только для MaXDeepLab.	Выявить объекты	Путь и имя файла для выходного классифицированного растра.
padding	Количество пикселов на границе листов изображений, из которых будут складываться прогнозные данные для смежных листов. Чтобы сгладить результат при уменьшении артефактов, увеличьте значение. Максимальное значение внутреннего отступа может составлять половину значения размера листа. Аргумент доступен для всех архитектур моделей.	Классифицировать пикселы Выявить изменения Выявить объекты	Целочисленные значения больше 0 и меньше, чем половина значения размера листа.
predict_background	Указывает, будет ли классифицирован класс фона. Аргумент доступен для UNET, PSPNET, DeepLab и MMSegmentation.	Классифицировать пикселы	true или false.
return_probability_raster	Указывает, будет ли растр вероятности выходными данными. Растр вероятности — это растр, пикселы которого определяют вероятность того, что интересующая переменная находится выше или ниже указанного порогового значения. Если ArcGISLearnVersion 1.8.4 или новее в файле .emd модели, доступны архитектуры MultiTaskRoadExtractor и ConnectNet. Если ArcGISLearnVersion 1.8.4 или новее и IsEdgeDetection есть в файле .emd модели, доступны архитектуры BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation.	Классифицировать пикселы	true или false.
score_threshold	Прогнозы выше этой оценки достоверности включаются в результат. Аргумент доступен для всех архитектур моделей. Этот аргумент, как правило, используется в моделях, обученных ранее ArcGIS Pro 3.5	Классифицировать объекты	От 0 до 1.0.
test_time_augmentation	Указывает, будет ли выполняться увеличение времени тестирования при прогнозировании. Если задано значение true, то конечный результат объединит прогнозы перевернутых и повернутых вариантов входного изображения. Аргумент доступен для большинства архитектур моделей.	Классифицировать объекты Классифицировать пикселы	true или false.
threshold	В результат включаются обнаруженные объекты, достоверность которых превышает это пороговое значение. Для инструмента Классифицировать объекты при помощи глубокого обучения этот аргумент доступен для всех архитектур моделей. Этот аргумент, как правило, используется в моделях, обученных в ArcGIS Pro 3.5 или более поздних версиях. Для инструмента Классифицировать пикселы при помощи глубокого обучения, если ArcGISLearnVersion 1.8.4 или новее в файле .emd модели, доступны архитектуры MultiTaskRoadExtractor и ConnectNet. Если ArcGISLearnVersion 1.8.4 или новее и IsEdgeDetection есть в файле .emd модели, доступны архитектуры BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation. Для инструмента Выявить объекты при помощи глубокого обучения этот агрумент доступен во всех архитектурах модели.	Классифицировать объекты Классифицировать пикселы Выявить объекты	от 0 до 1.0.
thinning	Указывает, будут ли прогнозируемые ребра утончены или скелетированы. Если IsEdgeDetection присутствует в файле .emd модели, BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation также являются доступными архитектурами.	Классифицировать пикселы	true или false.
tile_size	Ширина и высота листов изображений, на которые будет разбито изображение для прогнозирования. Для инструмента Классифицировать пикселы при помощи глубокого обучения, аргумент доступен только в архитектуре CycleGAN. Для инструмента Выявить объекты при помощи глубокого обучения аргумент доступен только для MaskRCNN.	Классифицировать пикселы Выявить объекты	Целочисленные значения больше 0 и меньше, чем половина значения размера изображения.

Связанные разделы

Отзыв по этому разделу?