Аргументы глубокого обучения

Доступно с лицензией Image Analyst.

Аргументы - один из вариантов управления способов обучения и использования моделей глубокого обучения. В данном разделе в первой таблице перечислены поддерживаемые аргументы модели для обучения моделей глубокого обучения. Во второй таблице перечислены аргументы, контролирующие, как модели глубокого обучения используются для вывода.

Обучающие аргументы

Инструмент Тренировать модель глубокого обучения включает аргументы для обучения моделей глубокого обучения. Аргументы различаются в зависимости от архитектуры модели. Вы можете менять значения этих аргументов для обучения моделей. Аргументы следующие:

  • attention_type — Определяет тип модуля. По умолчанию – PAM.
  • attn_res — Количество рассмотрений в остаточных блоках. Это необязательное целочисленное значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. По умолчанию это 16
  • backend — Определяет внутреннюю среду, которая будет использоваться для этой модели. Чтобы использовать Tensorflow, переключитесь на тип процессора CPU. По умолчанию – pytorch.
  • bias — Смещение для головного элемента Single Shot Detector (SSD). Значение по умолчанию -0,4.
  • box_batch_size_per_image — Количество предложений, которые выбираются во время обучения классификации. Значение по умолчанию 512.
  • box_bg_iou_thresh — Максимальное пересечение объединения (IoU) между предложениями и (истинным) блоком GT, чтобы их можно было считать отрицательными во время обучения головного элемента классификации. Значение по умолчанию равно 0.5.
  • box_detections_per_img — Максимальное количество обнаружений на изображение для всех классов. По умолчанию используется 100.
  • box_fg_iou_thresh — Минимальный IoU между предложениями и блоком GT, чтобы их можно было считать положительными во время обучения головного элемента классификации. Значение по умолчанию равно 0.5.
  • box_nms_thresh — Порог немаксимального подавления (NMS) для головного элемента прогнозирования, используемого во время вывода. Значение по умолчанию равно 0.5.
  • box_positive_fraction — Доля положительных предложений в мини-пакете во время обучения головного элемента классификации. По умолчанию – 0,25.
  • box_score_thresh — Порог оценки классификации, который должен быть достигнут для возврата предложений во время вывода. Значение по умолчанию 0,05.
  • channel_mults — Дополнительные множители глубины для последующих разрешений в U-Net. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. По умолчанию это 1, 2, 4, 4, 8, 8.
  • channels_of_interest — Список интересующих спектральных диапазонов (каналов). Фильтрует каналы растров разновременных временных рядов на основе этого списка. Например, если в наборе данных есть каналы 0–4, а обучение будет использовать только каналы 0,1 и 2, список будет [0,1,2].
  • chip_size — Размер изображения, которое будет использоваться для обучения модели. Изображения будут обрезаны до указанного размера чипа.
  • class_balancing — Указывает, будет ли обратная кросс-энтропийная потеря сбалансирована с частотой пикселов на класс. По умолчанию – False.
  • d_k — Измерение векторов ключа и запроса. Значение по умолчанию 32.
  • decode_params — Словарь, который определяет, как будет работать Image captioner. Он состоит из следующих параметров: embed_size, hidden_size, attention_size, teacher_forcing, dropout и pretrained_emb. Параметр teacher_forcing — это вероятность усиления учителем. Teacher forcing — это стратегия обучения рекуррентных нейронных сетей. Она использует выходные данные модели из предыдущего временного шага в качестве входных данных вместо предыдущих выходных данных во время обратной передачи ошибки обучения. Параметр pretrained_emb указывает, будет ли использоваться предварительно обученное встраивание текста. Если True, будет использоваться быстрое встраивание текста. Если False, предварительно обученное встраивание текста не будет использоваться.
  • depth — Глубина модели. По умолчанию 17.
  • depths — Количество блоков на каждом этапе. По умолчанию [3, 3, 9, 3].
  • dice_loss_average — Указывает, будет ли использоваться микроусреднение или макроусреднение. Макроусреднение вычислит показатель независимо для каждого класса и возьмет среднее, обрабатывая все классы одинаково. Микроусреднение объединит вклады всех классов для вычисления среднего показателя. В настройке многоклассовой классификации микроусреднение предпочтительнее, если возможен дисбаланс классов, при котором образцов одного класса намного больше, чем образцов других классов. По умолчанию - микроусреднение.
  • dice_loss_fraction - вес потерь по умолчанию (или фокусных потерь) по сравнению с разделенными потерями в общих потерях для управления обучением. По умолчанию - 0. Если focal_loss задано как true, вместо потерь по умолчанию используются фокусные потери. Если dice_loss_fraction задано как 0, обучение будет использовать значение потерь по умолчанию (либо фокальную потерю) в качестве общей потери для управления обучением. Если значение dice_loss fraction больше 0, то при обучении будет использоваться следующая формула для расчета общих потерь:
    =(1 – dice_loss_fraction)*default_loss + dice_loss_fraction*dice_loss
  • dims — Размерность объекта на каждом этапе. По умолчанию [96, 192, 384, 768].
  • downsample_factor - фактор, который будет использоваться для понижения разрешения изображений. Значение по умолчанию равно 4.
  • drop — Вероятность прореживания. Чтобы снизить переобучение, увеличьте это значение. По умолчанию 0,3.
  • dropout — Вероятность прореживания. Чтобы снизить переобучение, увеличьте это значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию зависит от значения параметра Тип модели.
  • drop_path_rate — Уровень стохастической глубины. Значение по умолчанию равно 0,0.
  • embed_dim — Измерение вставок. По умолчанию 768.
  • feat_loss — Указывает, будет ли использована дискриминаторная потеря сопоставления объектов. По умолчанию – True.
  • focal_loss — Указывает, будут ли использоваться фокальные потери. Фокальные потери могут решить проблему несбалансированности классов в однопроходной модели обнаружения объектов. По умолчанию – False.
  • gaussian_thresh — порог Гаусса, который задает требуемую ширину дороги. Допустимый диапазон от 0.0 до 1.0. По умолчанию 0.76.
  • gen_blocks — Количество блоков ResNet для использования в генераторе. По умолчанию 9.
  • gen_network — Указывает модель, которая будет использоваться для генератора. Используйте global, если мало памяти графического процессора. По умолчанию - local.
  • grids — Количество сеток, на которые будет разбито изображение для обработки. Например, значение аргумента равным 4 означает, что изображение будет разделено на 16 ячеек (4 x 4). Если значение не задано, оптимальное значение сетки будет рассчитано на основе входных изображений.
  • head_init_scale — Начальное значение масштаба для весов и смещений классификатора. По умолчанию 1.0.
  • ignore_classes – Список значений классов, при которых в модели не будет потерь.
  • inner_channel – Измерение первого слоя U-net. Это необязательное целочисленное значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию - 64.
  • keep_dilation — Указывает, будет ли использоваться растяжение. Установка значения True и использование архитектуры pointrend может потенциально улучшить точность за счет потребления памяти. По умолчанию – False.
  • lambda_feat — Вес потерь сопоставления объектов. Значение по умолчанию равно 10.
  • lambda_l1 — Вес потерь сопоставления объектов. Не поддерживается для 3-канальных изображений. По умолчанию используется 100.
  • layer_scale_init_value — Начальное значение масштаба слоя. Значение по умолчанию - 1e-6.
  • linear_end — Необязательное целое число для планирования окончания. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию 1e-06.
  • linear_start — Необязательное целое число для планирования запуска. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию 1e-02.
  • lsgan — Указывает, будет ли использоваться среднеквадратичная ошибка в обучении. Если задано False, будет использоваться двоичная перекрестная энтропия. По умолчанию – True.
  • location_loss_factor — Вес потерь ограничивающего прямоугольника. Этот фактор регулирует фокус модели на местоположении ограничивающего прямоугольника. Если задано значение None, вес потерь местоположения и потерь классификации будет одинаковым.
  • min_points — Количество пикселов, которые будут выбраны из каждой маскированной области обучения. Это значение должно быть кратно 64.
  • mixup — Указывает, будут ли создаваться новые обучающие изображения путем случайного смешивания обучающих изображений (True). По умолчанию – False.
  • mlp_ratio — Соотношение многослойного персептрона (MLP). Значение по умолчанию равно 4.
  • mlp1 — Измерения последовательных пространств объектов MLP1. По умолчанию - это 32,64.
  • mlp2 — Размеры последовательных пространств объектов MLP2. По умолчанию - это 128,128.
  • mlp4 — Размеры декодера MLP. По умолчанию - это 64,32.
  • model — Опорная модель, которая будет использоваться для обучения модели. Доступные опорные модели зависят от значения параметра Тип модели. Этот аргумент поддерживается только для типов модели MMDetection и MMSegmentation. Значение по умолчанию для MMDetection — cascade_rcnn. Значение по умолчанию для MMSegmentation — mask2former.
  • model_weight — Определяет, использовать ли веса предварительно обученной модели. Значением также может быть путь к файлу конфигурации, содержащему веса модели из репозитория MMDetection или репозитория MMSegmentation. По умолчанию – False.
  • monitor — Указывает, какая метрика будет отслеживаться при проверке и ранней остановке. Доступные метрики зависят от значения параметра Тип модели. По умолчанию – valid_loss.
  • mtl_model — Задает тип архитектуры, который будет использоваться для создания модели. Возможные варианты linknet или hourglass для нейронных архитектур на основе linknet или hourglass соответственно. По умолчанию hourglass.
  • n_blocks_global — Количество остаточных блоков в глобальной сети генератора. По умолчанию 9.
  • n_blocks_local — Количество остаточных блоков в локальной сети усилителя. Значение по умолчанию равно 3.
  • n_downsample_global — Количество слоев понижения частоты дискретизации в глобальной сети генератора.
  • n_dscr — Количество используемых дискриминаторов. Значение по умолчанию равно 2.
  • n_dscr_filters — Количество фильтров дискриминатора в первом уровне свертки. Значение по умолчанию - 64.
  • n_gen_filters — Количество фильтров gen в первом уровне свертки. Значение по умолчанию - 64.
  • n_head — Количество заголовков прерывания. Значение по умолчанию равно 4.
  • n_layers_dscr — Количество слоев для сети дискриминатора, используемой в Pix2PixHD. Значение по умолчанию равно 3.
  • n_local_enhancers — Количество используемых локальных усилителей. Значение по умолчанию равно 1.
  • n_masks — Максимальное количество надписей классов и экземпляров, которые может содержать любое изображение. Значение по умолчанию равно 30.
  • n_timestep — Количество временных шагов диффузии. Это необязательное значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию равно 1000.
  • norm — Указывает, будет ли использована нормализация экземпляров или пакетная нормализация. По умолчанию - нормализация экземпляров.
  • norm_groups — Количество групп для нормирования групп. Это необязательное целочисленное значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию 32.
  • num_heads — Количество заголовков прерывания. Значение по умолчанию равно 12.
  • orient_bin_size — Размер бина для углов ориентации. Значение по умолчанию равно 20.
  • orient_theta — Ширина маски ориентации. Значение по умолчанию - 8.
  • oversample — Указывает, будет ли использована избыточная выборка. Если задано значение True, несбалансированные классы набора данных будут подвергаться избыточной выборке во время обучения. Это ​​не поддерживается с наборами данных MultiLabel. По умолчанию – False.
  • patch_size — размер патча для генерации внедрений патча. Значение по умолчанию 16.
  • perceptual_loss — Указывает, будет ли использоваться перцептуальная потеря в обучении. По умолчанию – False.
  • pointrend — Указывает, будет ли использоваться архитектура PointRend поверх заголовка сегментации. Для получения дополнительной информации об архитектуре PointRend см. PointRend PDF. По умолчанию – False.
  • pooling — Стратегия объединения пикселов с внедрением, которая будет использоваться. По умолчанию - mean.
  • pyramid_sizes — Количество и размер слоев свертки, которые будут применяться к различным подобластям. Аргумент относится к модели Pyramid Scene Parsing Network. По умолчанию [1,2,3,6].
  • qkv_bias — Указывает, будет ли использоваться смещение вектора QK в обучении. По умолчанию – False.
  • ratios — Список пропорций, которые будут использоваться для рамок якоря. При обнаружении объекта рамка привязки представляет идеальное местоположение, форму и размер прогнозируемого объекта. Например, задание для этого аргумента [1.0,1.0], [1.0, 0.5] означает, что рамка якоря - это квадрат (1:1) или прямоугольник, горизонтальная сторона которого в два раза меньше вертикальной (1:0.5). По умолчанию для RetinaNet – [0.5,1,2]. По умолчанию для Single Shot Detector – [1.0, 1.0].
  • res_blocks — Количество остаточных блоков. Это необязательное целочисленное значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значение по умолчанию равно 3.
  • rpn_batch_size_per_image — Количество якорей, которые выбираются во время обучения RPN для вычисления потерь. Значение по умолчанию 256.
  • rpn_bg_iou_thresh — Максимальный IoU между якорем и блоком GT, чтобы их можно было считать отрицательными во время обучения RPN. По умолчанию 0,3.
  • rpn_fg_iou_thresh — Минимальный IoU между якорем и блоком GT, чтобы их можно было считать положительными во время обучения RPN. Значение по умолчанию 0,7.
  • rpn_nms_thresh — Порог NMS, который будет использоваться для постобработки предложений RPN. Значение по умолчанию 0,7.
  • rpn_positive_fraction — Доля положительных якорей в мини-пакете во время обучения RPN. Значение по умолчанию равно 0.5.
  • rpn_post_nms_top_n_test — Количество предложений, которые будут сохранены после применения NMS во время тестирования. Значение по умолчанию равно 1000.
  • rpn_post_nms_top_n_train — Количество предложений, которые будут сохранены после применения NMS во время обучения. Значение по умолчанию равно 2000.
  • rpn_pre_nms_top_n_test — Количество предложений, которые будут сохранены перед применением NMS во время тестирования. Значение по умолчанию равно 1000.
  • rpn_pre_nms_top_n_train — Количество предложений, которые будут сохранены перед применением NMS во время обучения. Значение по умолчанию равно 2000.
  • scales — Количество уровней масштабирования, на которые каждая ячейка будет увеличена или уменьшена. По умолчанию [1, 0.8, 0.63].
  • schedule — Тип расписания, который будет использоваться. Это необязательное значение. Варианты: linear, warmup10, warmup50, const, jsd и cosine. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3. Значением по умолчанию является Линейная.
  • T — Период, который будет использоваться для позиционного кодирования. Значение по умолчанию равно 1000.
  • timesteps_of_interest — Список интересующих временных шагов; это отфильтрует разновременные временные ряды на основе списка указанных временных шагов. Например, если набор данных имеет временные шаги 0, 1, 2 и 3, но в обучении используются только временные шаги 0, 1 и 2, этот параметр будет задан как [0,1,2]; остальные временные шаги будут отфильтрованы.
  • use_net – Задает, будет ли использоваться декодер U-Net для восстановления данных после завершения формирования пирамидного пула. Аргумент относится к модели Pyramid Scene Parsing Network. По умолчанию – True.
  • vgg_loss — Указывает, будет ли использована потеря соответствия объектов VGG. Поддерживается только для 3-канальных изображений. По умолчанию – True.
  • zooms — Количество уровней масштабирования, на которое каждая ячейка сетки будет увеличена или уменьшена. Установка для этого аргумента значения 1 означает, что все ячейки сетки останутся в том же размере или уровне масштабирования. Уровень масштабирования 2 означает, что все ячейки сетки станут в два раза больше (увеличены на 100 процентов). Предоставление списка уровней масштабирования означает, что все ячейки сетки будут масштабироваться с использованием всех значений в списке. Значение по умолчанию равно 1.

Тип моделиАргументКорректные значения

3D-RCNet

(классификация пикселов)

depths

Список положительных целых чисел. По умолчанию [3, 3, 9, 3].

dims

Список положительных целых чисел. По умолчанию [96, 192, 384, 768].

drop_path_rate

Значения с плавающей запятой. Значение по умолчанию равно 0,0.

head_init_scale

Значения с плавающей запятой. По умолчанию 1.0.

layer_scale_init_value

Значения с плавающей запятой. Значение по умолчанию - 1e-6.

Изменить детектор

(классификация пикселов)

attention_type

PAM (Pyramid Attention Module) или BAM (Basic Attention Module). По умолчанию – PAM.

chip_size

Целые числа от 0 до размера изображения.

monitor

valid_loss, precision, recall и f1. По умолчанию – valid_loss.

ConnectNet

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

gaussian_thresh

0.0 до 1.0. По умолчанию 0.76.

monitor

valid_loss, accuracy, miou и dice. По умолчанию – valid_loss.

mtl_model

linknet или hourglass. По умолчанию – hourglass.

orient_bin_size

Положительное число. Значение по умолчанию равно 20.

orient_theta

Положительное число. Значение по умолчанию - 8.

CycleGAN

(преобразование изображения)

gen_blocks

Положительное целое число. По умолчанию 9.

lsgan

true или false. По умолчанию – true.

DeepLabv

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

class_balancing

true или false. По умолчанию – false.

dice_loss_average

micro или macro. По умолчанию – micro.

dice_loss_fraction

Значение с плавающей точкой от 0 до 1. По умолчанию - 0.

focal_loss

true или false. По умолчанию – false.

ignore_classes

Допустимые значения классов.

keep_dilation

true или false. По умолчанию – false.

mixup

true или false. По умолчанию – false.

monitor

valid_loss и accuracy. По умолчанию – valid_loss.

pointrend

true или false. По умолчанию – false.

FasterRCNN

(Выявление объектов)

box_batch_size_per_image

Положительные целые числа. Значение по умолчанию 512.

box_bg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_detections_per_img

Положительные целые числа. По умолчанию используется 100.

box_fg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_nms_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_positive_fraction

Значение с плавающей точкой от 0 до 1. По умолчанию – 0,25.

box_score_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,05.

rpn_batch_size_per_image

Положительные целые числа. Значение по умолчанию 256.

rpn_bg_iou_thresh

Значение с плавающей точкой от 0 до 1. По умолчанию 0,3.

rpn_fg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.

rpn_nms_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.

rpn_positive_fraction

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

rpn_post_nms_top_n_test

Положительные целые числа. Значение по умолчанию равно 1000.

rpn_post_nms_top_n_train

Положительные целые числа. Значение по умолчанию равно 2000.

rpn_pre_nms_top_n_test

Положительные целые числа. Значение по умолчанию равно 1000.

rpn_pre_nms_top_n_train

Положительные целые числа. Значение по умолчанию равно 2000.

Feature Classifier

(Классификация объектов)

backend

pytorch или tensorflow. По умолчанию – pytorch.

mixup

true или false. По умолчанию – false.

oversample

true или false. По умолчанию – false.

Image captioner

(преобразование изображения)

chip_size

Целые числа от 0 до размера изображения.

Аргумент decode_params состоит из следующих шести параметров:

  • embed_size
  • hidden_size
  • attention_size
  • teacher_forcing
  • dropout
  • pretrained_emb

По умолчанию – {'embed_size':100, 'hidden_size':100, 'attention_size':100, 'teacher_forcing':1, 'dropout':0.1, 'pretrained_emb':False}.

monitor

valid_loss, accuracy, corpus_bleu и multi_label_fbeta. По умолчанию – valid_loss.

MaskRCNN

(Выявление объектов)

box_batch_size_per_image

Положительные целые числа. Значение по умолчанию 512.

box_bg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_detections_per_img

Положительные целые числа. По умолчанию используется 100.

box_fg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_nms_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_positive_fraction

Значение с плавающей точкой от 0 до 1. По умолчанию – 0,25.

box_score_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,05.

rpn_batch_size_per_image

Положительные целые числа. Значение по умолчанию 256.

rpn_bg_iou_thresh

Значение с плавающей точкой от 0 до 1. По умолчанию 0,3.

rpn_fg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.

rpn_nms_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.

rpn_positive_fraction

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

rpn_post_nms_top_n_test

Положительные целые числа. Значение по умолчанию равно 1000.

rpn_post_nms_top_n_train

Положительные целые числа. Значение по умолчанию равно 2000.

rpn_pre_nms_top_n_test

Положительные целые числа. Значение по умолчанию равно 1000.

rpn_pre_nms_top_n_train

Положительные целые числа. Значение по умолчанию равно 2000.

MaXDeepLab

(общая сегментация)

n_masks

Положительные целые числа. Значение по умолчанию равно 30.

MMDetection

(выявление объектов)

chip_size

Целые числа от 0 до размера изображения.

model

atss, carafe, cascade_rcnn, cascade_rpn, dcn, deeplabv3, detectors, dino, double_heads, dynamic_rcnn, empirical_attention, fcos, foveabox, fsaf, ghm, hrnet, libra_rcnn, nas_fcos, pafpn, pisa, regnet, reppoints, res2net, sabl и vfnet.

По умолчанию – deeplabv3.

model_weight

true или false.

MMSegmentation

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

model

ann, apcnet, ccnet, cgnet, deeplabv3, deeplabv3plus, dmnet , dnlnet, emanet, fastscnn, fcn, gcnet, hrnet, mask2former, mobilenet_v2, nonlocal_net, ocrnet, prithvi100m, psanet, pspnet, resnest, sem_fpn, unet и upernet.

По умолчанию – mask2former.

model_weight

true или false. По умолчанию – false.

Multi Task Road Extractor

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

gaussian_thresh

0.0 до 1.0. По умолчанию 0.76.

monitor

valid_loss, accuracy, miou и dice. По умолчанию – valid_loss.

mtl_model

linknet или hourglass. По умолчанию – hourglass.

orient_bin_size

Положительное число. Значение по умолчанию равно 20.

orient_theta

Положительное число. Значение по умолчанию - 8.

Pix2Pix

(преобразование изображения)

perceptual_loss

true или false. По умолчанию – false.

Pix2PixHD

(преобразование изображения)

feat_loss

true или false. По умолчанию – true.

gen_network

local или global. По умолчанию – local.

lambda_feat

Положительные целые значения. Значение по умолчанию равно 10.

lambda_l1

Положительные целые значения. По умолчанию используется 100.

lsgan

true или false. По умолчанию – true.

n_blocks_global

Положительные целые значения. По умолчанию 9.

n_blocks_local

Положительные целые значения. Значение по умолчанию равно 3.

n_downsample_global

Положительные целые значения. Значение по умолчанию равно 4.

n_dscr

Положительные целые значения. Значение по умолчанию равно 2.

n_dscr_filters

Положительные целые значения. Значение по умолчанию - 64.

n_gen_filters

Положительные целые значения. Значение по умолчанию - 64.

n_layers_dscr

Положительные целые значения. Значение по умолчанию равно 3.

n_local_enhancers

Положительные целые значения. Значение по умолчанию равно 1.

norm

instance или batch. По умолчанию – instance.

vgg_loss

true или false. По умолчанию – true.

PSETAE

(классификация пикселов)

channels_of_interest

Список номеров каналов (положительные целые значения).

d_k

Положительные целые значения. Значение по умолчанию 32.

dropout

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,2.

min_points

Целые числа, кратные 64.

mlp1

Список положительных целых чисел. По умолчанию - это 32,64.

mlp2

Список положительных целых чисел. По умолчанию - это 128,128.

mlp4

Список положительных целых чисел. По умолчанию - это 64,32.

n_head

Положительные целые значения. Значение по умолчанию равно 4.

pooling

mean, std, max или min. По умолчанию – mean.

T

Положительные целые значения. Значение по умолчанию равно 1000.

timesteps_of_interest

Список положительных целых чисел.

Pyramid Scene Parsing Network

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

class_balancing

true или false. По умолчанию – false.

dice_loss_average

micro или macro. По умолчанию – micro.

dice_loss_fraction

Значение с плавающей точкой от 0 до 1. По умолчанию - 0.

focal_loss

true или false. По умолчанию – false.

ignore_classes

Допустимые значения классов.

keep_dilation

true или false. По умолчанию – false.

mixup

true или false. По умолчанию – false.

monitor

valid_loss или accuracy. По умолчанию – valid_loss.

pointrend

true или false. По умолчанию – false.

pyramid_sizes

[уровень свертки 1, уровень свертки 2, ... , уровень свертки n]

use_net

true или false. По умолчанию – true.

RetinaNet

(выявление объектов)

chip_size

Целые числа от 0 до размера изображения.

monitor

valid_loss или average_precision. По умолчанию – valid_loss.

ratios

Значение отношения 1, значение отношения 2, значение отношения 3.

По умолчанию 0.5,1,2.

scales

[значение шкалы 1, значение шкалы 2, значение шкалы 3]

По умолчанию [1, 0.8, 0.63].

SAMLoRA

(классификация пикселов)

class_balancing

true или false. По умолчанию – false.

ignore_classes

Допустимые значения классов.

Single Shot Detector

(выявление объектов)

backend

pytorch или tensorflow. По умолчанию – pytorch.

bias

Значение с плавающей точкой. Значение по умолчанию -0,4.

chip_size

Целые числа от 0 до размера изображения. По умолчанию 0,3.

drop

Значение с плавающей точкой от 0 до 1.

focal_loss

true или false. По умолчанию – false.

grids

Целочисленные значения больше 0.

location_loss_factor

Значение с плавающей точкой от 0 до 1.

monitor

valid_loss или average_precision. По умолчанию – valid_loss.

ratios

[значение по горизонтали, значение по вертикали]

zooms

Значение увеличения, где 1.0 - отсутствие увеличения.

Super-resolution с опорной моделью SR3

(преобразование изображения)

attn_res

Целочисленные значения больше 0. По умолчанию это 16.

channel_mults

Наборы целочисленных множителей. По умолчанию это [1, 2, 4, 4, 8, 8].

downsample_factor

Положительные целые значения. Значение по умолчанию равно 4.

dropout

Значение с плавающей точкой. По умолчанию - 0.

inner_channel

Целочисленное значение больше 0. Значение по умолчанию - 64.

linear_start

Целочисленное значение времени. Значение по умолчанию 1e-02.

linear_end

Целочисленное значение времени. Значение по умолчанию 1e-06.

n_timestep 

Целочисленное значение больше 0. Значение по умолчанию равно 1000.

norm_groups

Целочисленное значение больше 0. Значение по умолчанию 32.

res_blocks

Целочисленное значение больше 0. Значение по умолчанию равно 3.

schedule 

linear, warmup10, warmup50, const, jsd, или cosine.

По умолчанию – linear.

Суперразрешение с опорной моделью SR3_UViT

(преобразование изображения)

depth

Положительное целое числовое значение. По умолчанию 17.

embed_dim

Положительное целое числовое значение. По умолчанию 768.

mlp_ratio

Положительное значение с плавающей запятой. По умолчанию 4,0.

num_heads

Положительное целое числовое значение. Значение по умолчанию равно 12.

patch_size

Положительное целое числовое значение. По умолчанию это 16.

qkv_bias

true или false. По умолчанию – false.

U-Net

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

class_balancing

true или false. По умолчанию – false.

dice_loss_average

micro или macro. По умолчанию – micro.

dice_loss_fraction

Значение с плавающей точкой от 0 до 1. По умолчанию - 0.

focal_loss

true или false. По умолчанию – false.

ignore_classes

Допустимые значения классов.

mixup

true или false. По умолчанию – false.

monitor

valid_loss или accuracy. По умолчанию - valid_loss.

Выводящие аргументы

Следующие аргументы доступны для, контроля, как обучаются модели глубокого обучения для вывода. Информация из параметра Определение модели используется для заполнения параметра Аргументы в инструментах вывода. Аргументы различаются в зависимости от архитектуры модели. Предварительно обученные модели ArcGIS и пользовательские модели глубокого обучения могут включать дополнительные аргументы, которые поддерживаются инструментом.

АргументТип выводаКорректные значения

batch_size

Количество листов изображений, которые будут обработаны на каждом этапе построения модели. Оно зависит от объема памяти вашего графического адаптера. Аргумент доступен для всех архитектур моделей.

Классифицировать объекты

Классифицировать пикселы

Выявить изменения

Выявить объекты

Целочисленные значения больше 0; обычно целое число в степени 2n.

direction

Направление, в котором изображение передается из одного домена в другой. Более подробную информацию об этом аргументе см. в Как работает CycleGAN.

Аргумент доступен только для архитектуры CycleGAN.

Классифицировать пикселы

Доступными опциями являются AtoB и BtoA.

exclude_pad_detections

Указывает, будут ли фильтроваться усеченные обнаружения вблизи краев, которые находятся в дополненной области фрагментов изображений.

Аргумент доступен только для SSD, RetinaNet, YOLOv3, DETReg, MMDetection и Faster RCNN.

Выявить объекты

true или false.

merge_policy

Политика, которая будет использоваться для объединения расширенных прогнозов. Это применимо только при использовании увеличения времени тестирования.

Для инструмента Классифицировать пикселы при помощи глубокого обучения аргумент доступен в арххитектурах MultiTaskRoadExtractor и ConnectNet. Если IsEdgeDetection присутствует в файле .emd модели, BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation также являются доступными архитектурами.

Для инструмента Выявить объекты при помощи глубокого обучения аргумент доступен только для MaskRCNN.

Классифицировать пикселы

Выявить объекты

Доступные опции mean, max и min.

nms_overlap

Коэффициент максимального перекрытия для двух перекрывающихся объектов, который определяется как отношение площади пересечения к площади объединения. Аргумент доступен для всех архитектур моделей.

Выявить объекты

Значение с плавающей точкой от 0.0 до 1.0. Значение по умолчанию равно 0.1.

output_classified_raster

Путь к выходному растру. Аргумент доступен только для MaXDeepLab.

Выявить объекты

Путь и имя файла для выходного классифицированного растра.

padding

Количество пикселов на границе листов изображений, из которых будут складываться прогнозные данные для смежных листов. Чтобы сгладить результат при уменьшении артефактов, увеличьте значение. Максимальное значение внутреннего отступа может составлять половину значения размера листа. Аргумент доступен для всех архитектур моделей.

Классифицировать пикселы

Выявить изменения

Выявить объекты

Целочисленные значения больше 0 и меньше, чем половина значения размера листа.

predict_background

Указывает, будет ли классифицирован класс фона. Аргумент доступен для UNET, PSPNET, DeepLab и MMSegmentation.

Классифицировать пикселы

true или false.

return_probability_raster

Указывает, будет ли растр вероятности выходными данными. Растр вероятности — это растр, пикселы которого определяют вероятность того, что интересующая переменная находится выше или ниже указанного порогового значения.

Если ArcGISLearnVersion 1.8.4 или новее в файле .emd модели, доступны архитектуры MultiTaskRoadExtractor и ConnectNet. Если ArcGISLearnVersion 1.8.4 или новее и IsEdgeDetection есть в файле .emd модели, доступны архитектуры BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation.

Классифицировать пикселы

true или false.

score_threshold

Прогнозы выше этой оценки достоверности включаются в результат. Аргумент доступен для всех архитектур моделей.

Этот аргумент, как правило, используется в моделях, обученных ранее ArcGIS Pro 3.5

Классифицировать объекты

От 0 до 1.0.

test_time_augmentation

Указывает, будет ли выполняться увеличение времени тестирования при прогнозировании. Если задано значение true, то конечный результат объединит прогнозы перевернутых и повернутых вариантов входного изображения. Аргумент доступен для большинства архитектур моделей.

Классифицировать объекты

Классифицировать пикселы

true или false.

threshold

В результат включаются обнаруженные объекты, достоверность которых превышает это пороговое значение.

Для инструмента Классифицировать объекты при помощи глубокого обучения этот аргумент доступен для всех архитектур моделей. Этот аргумент, как правило, используется в моделях, обученных в ArcGIS Pro 3.5 или более поздних версиях.

Для инструмента Классифицировать пикселы при помощи глубокого обучения, если ArcGISLearnVersion 1.8.4 или новее в файле .emd модели, доступны архитектуры MultiTaskRoadExtractor и ConnectNet. Если ArcGISLearnVersion 1.8.4 или новее и IsEdgeDetection есть в файле .emd модели, доступны архитектуры BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation.

Для инструмента Выявить объекты при помощи глубокого обучения этот агрумент доступен во всех архитектурах модели.

Классифицировать объекты

Классифицировать пикселы

Выявить объекты

от 0 до 1.0.

thinning

Указывает, будут ли прогнозируемые ребра утончены или скелетированы.

Если IsEdgeDetection присутствует в файле .emd модели, BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation также являются доступными архитектурами.

Классифицировать пикселы

true или false.

tile_size

Ширина и высота листов изображений, на которые будет разбито изображение для прогнозирования.

Для инструмента Классифицировать пикселы при помощи глубокого обучения, аргумент доступен только в архитектуре CycleGAN.

Для инструмента Выявить объекты при помощи глубокого обучения аргумент доступен только для MaskRCNN.

Классифицировать пикселы

Выявить объекты

Целочисленные значения больше 0 и меньше, чем половина значения размера изображения.

Связанные разделы