Аргументы глубокого обучения

Доступно с лицензией Image Analyst.

Аргументы - один из вариантов управления способов обучения и использования моделей глубокого обучения. В данном разделе в первой таблице перечислены поддерживаемые аргументы модели для обучения моделей глубокого обучения. Во второй таблице перечислены аргументы, контролирующие, как модели глубокого обучения используются для вывода.

Обучающие аргументы

Инструмент Тренировать модель глубокого обучения включает аргументы для обучения моделей глубокого обучения. Аргументы различаются в зависимости от архитектуры модели. Вы можете менять значения этих аргументов для обучения моделей. Аргументы следующие:

  • attention_type — определяет тип модуля. По умолчанию – PAM.
  • attn_res — Количество рассмотрений в остаточных блоках. Это дополнительное целочисленное значение, по умолчанию равное 16. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
  • backend — Управляет внутренней средой, которая будет использоваться для этой модели. Чтобы использовать Tensorflow, переключитесь на тип процессора CPU. По умолчанию – pytorch.
  • bias — Смещение для головного элемента Single Shot Detector (SSD). Значение по умолчанию -0,4.
  • box_batch_size_per_image — Количество предложений, которые выбираются во время обучения классификации. Значение по умолчанию 512.
  • box_bg_iou_thresh — Максимальное пересечение объединения (IoU) между предложениями и (истинным) блоком GT, чтобы их можно было считать отрицательными во время обучения головного элемента классификации. Значение по умолчанию равно 0.5.
  • box_detections_per_img — Максимальное количество обнаружений на изображение для всех классов. По умолчанию используется 100.
  • box_fg_iou_thresh — Минимальный IoU между предложениями и блоком GT, чтобы их можно было считать положительными во время обучения головного элемента классификации. Значение по умолчанию равно 0.5.
  • box_nms_thresh — Порог не максимального подавления (NMS) для головного элемента прогнозирования; используется во время вывода. Значение по умолчанию равно 0.5.
  • box_positive_fraction — Доля положительных предложений в мини-пакете во время обучения головного элемента классификации. По умолчанию – 0,25.
  • box_score_thresh — Порог оценки классификации, который должен быть достигнут для возврата предложений во время вывода. По умолчанию 0,05.
  • channel_mults — дополнительные множители глубины для последующих разрешений в U-Net. По умолчанию это 1, 2, 4, 4, 8, 8. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
  • channels_of_interest — Список интересующих спектральных диапазонов (каналов). Фильтрует каналы растров разновременных временных рядов на основе этого списка. Например, если в нашем наборе данных есть каналы 0–4, а обучение будет использовать только каналы 0,1 и 2, список будет [0,1,2].
  • chip_size — Размер изображения, которое будет использоваться для обучения модели. Изображения будут обрезаны до указанного размера чипа.
  • class_balancing — указывает, будет ли обратная кросс-энтропийная потеря сбалансирована с частотой пикселов на класс. По умолчанию – False.
  • d_k — Измерение векторов ключа и запроса. Значение по умолчанию 32.
  • decode_params — словарь, который определяет, как будет работать Image captioner. Он состоит из следующих параметров: embed_size, hidden_size, attention_size, teacher_forcing, dropout и pretrained_emb. teacher_forcing — вероятность усиления учителем. Teacher forcing — это стратегия обучения рекуррентных нейронных сетей. Она использует выходные данные модели из предыдущего временного шага в качестве входных данных вместо предыдущих выходных данных во время обратной передачи ошибки обучения. pretrained_emb указывает, будет ли использоваться предварительно обученное встраивание текста. Если True, будет использоваться быстрое встраивание текста. Если False, предварительно обученное встраивание текста не будет использоваться.
  • depth — Глубина модели. По умолчанию 17.
  • dice_loss_average — Выберите, использовать ли микро или макроусреднение. Макроусреднение вычислит метрику независимо для каждого класса, а затем возьмет среднее, тем самым обрабатывая все классы одинаково). Микроусреднение объединит вклады всех классов для вычисления средней метрики. В настройке многоклассовой классификации микроусреднение предпочтительнее, если вы предполагаете дисбаланс классов, когда образцов одного класса намного больше, чем других классов. По умолчанию – micro.
  • dice_loss_fraction — Используется для корректировки веса потерь по умолчанию (или фокусных потерь) по сравнению с разделенными потерями в общих потерях для управления обучением. По умолчанию - 0. Если focal_loss задано как true, вместо потерь по умолчанию используются фокусные потери. Если dice_loss_fraction задано как 0, обучение будет использовать значение потерь по умолчанию (либо фокальную потерю) в качестве общей потери для управления обучением. Если dice_loss больше 0, обучение будет использовать формулу для вычисления общей потери для управления обучением:
    =(1 – dice_loss_fraction)*default_loss + dice_loss_fraction*dice_loss
  • downsample_factor — Фактор для понижения разрешения изображений. Значение по умолчанию равно 4.
  • drop — Вероятность прореживания. Чтобы снизить переобучение, увеличьте это значение. По умолчанию 0,3.
  • dropout — Вероятность прореживания. Чтобы снизить переобучение, увеличьте это значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
  • embed_dim — Измерение вставок. По умолчанию 768.
  • feat_loss — Указывает, использовать ли дискриминаторную потерю сопоставления объектов. По умолчанию – True.
  • focal_loss — указывает, будут ли использоваться фокальные потери. По умолчанию – False.
  • gaussian_thresh — порог Гаусса, который задает требуемую ширину дороги. Допустимый диапазон от 0.0 до 1.0. По умолчанию 0.76.
  • gen_blocks — Количество блоков ResNet для использования в генераторе. По умолчанию 9.
  • gen_network — Выберите модель для использования в генераторе. Используйте global, если мало памяти графического процессора. По умолчанию – local.
  • grids — количество сеток, на которые будет разбито изображение для обработки. Например, значение аргумента равным 4 означает, что изображение будет разделено на 16 ячеек (4 x 4). Если значение не задано, оптимальное значение сетки будет рассчитано на основе входных изображений.
  • ignore_classes – список значений классов, при которых в модели не будет потерь.
  • inner_channel – измерение первого слоя U-net. Это необязательное целочисленное значение. Значение по умолчанию - 64. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
  • keep_dilation — Укажите, использовать ли keep_dilation. Если установлено значение True и используется архитектура pointrend, это может потенциально улучшить точность за счет потребления памяти. По умолчанию – False.
  • lambda_feat — Вес потерь сопоставления объектов. Значение по умолчанию равно 10.
  • lambda_l1 — Вес потерь сопоставления объектов. По умолчанию используется 100. Не поддерживается для 3-канальных изображений.
  • linear_end — необязательное целое число для планирования окончания. Значение по умолчанию 1e-06. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
  • linear_start — необязательное целое число для планирования запуска. Значение по умолчанию 1e-02. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
  • lsgan — Указывает, использовать ли среднеквадратичную ошибку в обучении. Если задано False, будет использоваться двоичная перекрестная энтропия. По умолчанию – True.
  • location_loss_factor — Задает вес потерь ограничивающего прямоугольника. Этот фактор регулирует фокус модели на местоположении ограничивающего прямоугольника. Если задано значение None, вес потерь местоположения и потерь классификации будет одинаковым.
  • min_points— Количество пикселов для выборки из каждой маскированной области обучения; это значение должно быть кратно 64.
  • mixup — Выберите, использовать ли mixup. Если установлено значение True, то создаются новые обучающие изображения путем случайного смешивания обучающих изображений. По умолчанию – False.
  • mlp_ratio — Соотношение многослойного персептрона (MLP). Значение по умолчанию равно 4.
  • mlp1 — Измерения последовательных пространств объектов MLP1. По умолчанию – 32,64.
  • mlp2 — Размеры последовательных пространств объектов MLP2. По умолчанию – 128,128.
  • mlp4 — Размеры декодера MLP. По умолчанию – 64,32.
  • model — опорная модель, используемая для обучения модели. Доступные опорные модели зависят от значения параметра Тип модели. Этот аргумент поддерживается только для типов модели MMDetection и MMSegmentation. Значение по умолчанию для MMDetection — cascade_rcnn. Значение по умолчанию для MMSegmentation — mask2former.
  • model_weight — определяет, использовать ли веса предварительно обученной модели. По умолчанию – False. Значением также может быть путь к файлу конфигурации, содержащему веса модели из репозитория MMDetection или репозитория MMSegmentation.
  • monitor — указывает, какую метрику следует отслеживать во время проверки и ранней остановки. Доступные метрики зависят от значения параметра Тип модели. По умолчанию – valid_loss.
  • mtl_model — задает тип архитектуры, который будет использоваться для создания модели. Возможные варианты linknet или hourglass для нейронных архитектур на основе linknet или hourglass соответственно. По умолчанию – hourglass.
  • n_blocks_global — Количество остаточных блоков в глобальной сети генератора. По умолчанию 9.
  • n_blocks_local — Количество остаточных блоков в локальной сети усилителя. Значение по умолчанию равно 3.
  • n_downsample_global — Количество слоев понижения частоты дискретизации в глобальной сети генератора.
  • n_dscr — Количество используемых дискриминаторов. Значение по умолчанию равно 2.
  • n_dscr_filters — Количество фильтров дискриминатора в первом уровне свертки. Значение по умолчанию - 64.
  • n_gen_filters — Количество фильтров gen в первом уровне свертки. Значение по умолчанию - 64.
  • n_head — Количество заголовков прерывания. Значение по умолчанию равно 4.
  • n_layers_dscr — Количество уровней для сети дискриминатора, используемой в Pix2PixHD. Значение по умолчанию равно 3.
  • n_local_enhancers — Количество используемых локальных усилителей. Значение по умолчанию равно 1.
  • n_masks — Представляет максимальное количество надписей классов и экземпляров, которые может содержать любое изображение. Значение по умолчанию равно 30.
  • n_timestep — необязательное значение для количества временных шагов диффузии. Значение по умолчанию равно 1000. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
  • norm — Указывает, использовать ли нормализацию экземпляров или пакетную нормализацию. По умолчанию – instance.
  • norm_groups — количество групп для нормирования групп. Это необязательное целочисленное значение. Значение по умолчанию 32. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
  • num_heads — Количество заголовков прерывания. Значение по умолчанию равно 12.
  • orient_bin_size — размер бина для углов ориентации. Значение по умолчанию равно 20.
  • orient_theta — ширина маски ориентации. Значение по умолчанию - 8.
  • oversample — Указывает, использовать ли избыточную выборку. Если задано значение True, он избыточно выбирает несбалансированные классы набора данных во время обучения. Это ​​не поддерживается с наборами данных MultiLabel. По умолчанию – False.
  • patch_size — Размер патча для генерации внедрений патча. Значение по умолчанию 16.
  • perceptual_loss — Указывает, использовать ли перцептуальную потерю в обучении. По умолчанию – False.
  • pointrend — Указывает, использовать ли архитектуру PointRend поверх заголовка сегментации. Для получения дополнительной информации об архитектуре PointRend см. PointRend PDF. По умолчанию – False.
  • pooling — Стратегия объединения пикселов с внедрением, которую следует использовать. Значение по умолчанию mean
  • pyramid_sizes — количество и размер слоев свертки, которые должны применяться к различным субрегионам. По умолчанию [1,2,3,6]. Аргумент относится к модели Pyramid Scene Parsing Network.
  • qkv_bias — Указывает, использовать ли смещение вектора QK при обучении. По умолчанию – False.
  • ratios — список отношений сторон, используемых для рамок привязки. При обнаружении объекта рамка привязки представляет идеальное местоположение, форму и размер прогнозируемого объекта. Например, задание для этого аргумента [1.0,1.0], [1.0, 0.5] означает, что рамка якоря - это квадрат (1:1) или прямоугольник, горизонтальная сторона которого в два раза меньше вертикальной (1:0.5). По умолчанию для RetinaNet – [0.5,1,2]. По умолчанию для Single Shot Detector – [1.0, 1.0].
  • res_blocks — количество остаточных блоков. Это необязательное целочисленное значение. Значение по умолчанию равно 3. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
  • rpn_batch_size_per_image — Количество якорей, которые выбираются во время обучения RPN для вычисления потерь. Значение по умолчанию 256.
  • rpn_bg_iou_thresh — Максимальный IoU между якорем и блоком GT, чтобы их можно было считать отрицательными во время обучения RPN. По умолчанию 0,3.
  • rpn_fg_iou_thresh — Минимальный IoU между якорем и блоком GT, чтобы их можно было считать положительными во время обучения RPN. Значение по умолчанию 0,7.
  • rpn_nms_thresh — Порог NMS, используемый для постобработки предложений RPN. Значение по умолчанию 0,7.
  • rpn_positive_fraction — Доля положительных якорей в мини-пакете во время обучения RPN. Значение по умолчанию равно 0.5.
  • rpn_post_nms_top_n_test — Количество предложений, которые нужно сохранить после применения NMS во время тестирования. Значение по умолчанию равно 1000.
  • rpn_post_nms_top_n_train — Количество предложений, которые нужно сохранить после применения NMS во время обучения. Значение по умолчанию равно 2000.
  • rpn_pre_nms_top_n_test — Количество предложений, которые нужно сохранить до применения NMS во время тестирования. Значение по умолчанию равно 1000.
  • rpn_pre_nms_top_n_train — Количество предложений, которые нужно сохранить до применения NMS во время обучения. Значение по умолчанию равно 2000.
  • scales — количество уровней масштабирования, на которые каждая ячейка будет увеличена или уменьшена. По умолчанию [1, 0.8, 0.63].
  • schedule — Необязательный аргумент для установки типа используемого расписания. Варианты: linear, warmup10, warmup50, const, jsd и cosine. Значением по умолчанию является Линейная. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
  • T — Период, который нужно использовать для позиционного кодирования. Значение по умолчанию равно 1000.
  • timesteps_of_interest — Список интересующих временных шагов; это отфильтрует разновременные временные ряды на основе списка указанных временных шагов. Например, если набор данных имеет связующие шаги 0, 1, 2 и 3, но в обучении используются только временные шаги 0, 1 и 2, этот параметр будет задан как [0,1,2]; the rest of the time-steps will be filtered out.
  • use_net – Задает, будет ли использоваться декодер U-Net для восстановления данных после завершения формирования пирамидного пула. По умолчанию – True. Аргумент относится к модели Pyramid Scene Parsing Network.
  • vgg_loss — Укажите, следует ли использовать потерю соответствия объектов VGG. Поддерживается только для 3-канальных изображений. По умолчанию – True.
  • zooms — количество уровней масштабирования, на которое каждая ячейка сетки будет увеличена или уменьшена. Установка для этого аргумента значения 1 означает, что все ячейки сетки останутся в том же размере или уровне масштабирования. Уровень масштабирования 2 означает, что все ячейки сетки станут в два раза больше (увеличены на 100 процентов). Предоставление списка уровней масштабирования означает, что все ячейки сетки будут масштабироваться с использованием всех значений в списке. Значение по умолчанию равно 1.

Тип моделиАргументКорректные значения

Изменить детектор

(классификация пикселов)

attention_type

PAM (Pyramid Attention Module) или BAM (Basic Attention Module). По умолчанию – PAM.

chip_size

Целые числа от 0 до размера изображения.

monitor

valid_loss, precision, recall и f1.

ConnectNet

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

gaussian_thresh

0.0 до 1.0. По умолчанию 0.76.

monitor

valid_loss, accuracy, miou и dice.

mtl_model

linknet или hourglass.

orient_bin_size

Положительное число. Значение по умолчанию равно 20.

orient_theta

Положительное число. Значение по умолчанию - 8.

CycleGAN

(преобразование изображения)

gen_blocks

Положительное целое число. Значение по умолчанию 9.

lsgan

true или false. По умолчанию – true.

DeepLabv

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

class_balancing

true или false.

dice_loss_average

micro или macro. По умолчанию – micro.

dice_loss_fraction

Значение с плавающей точкой от 0 до 1. По умолчанию - 0.

focal_loss

true или false.

ignore_classes

Допустимые значения классов.

keep_dilation

true или false. По умолчанию – false.

mixup

true или false.

monitor

valid_loss и accuracy.

pointrend

true или false. По умолчанию – false.

FasterRCNN

(Выявление объектов)

box_batch_size_per_image

Положительные целые числа. Значение по умолчанию 512.

box_bg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_detections_per_img

Положительные целые числа. По умолчанию используется 100.

box_fg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_nms_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_positive_fraction

Значение с плавающей точкой от 0 до 1. По умолчанию – 0,25.

box_score_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,05.

rpn_batch_size_per_image

Положительные целые числа. Значение по умолчанию 256.

rpn_bg_iou_thresh

Значение с плавающей точкой от 0 до 1. По умолчанию 0,3.

rpn_fg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.

rpn_nms_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.

rpn_positive_fraction

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

rpn_post_nms_top_n_test

Положительные целые числа. Значение по умолчанию равно 1000.

rpn_post_nms_top_n_train

Положительные целые числа. Значение по умолчанию равно 2000.

rpn_pre_nms_top_n_test

Положительные целые числа. Значение по умолчанию равно 1000.

rpn_pre_nms_top_n_train

Положительные целые числа. Значение по умолчанию равно 2000.

Feature Classifier

(Классификация объектов)

backend

pytorch или tensorflow. По умолчанию – pytorch.

mixup

true или false. По умолчанию – false.

oversample

true или false. По умолчанию – false.

Image captioner

(преобразование изображения)

chip_size

Целые числа от 0 до размера изображения.

Аргумент decode_params состоит из следующих шести параметров:

  • embed_size
  • hidden_size
  • attention_size
  • teacher_forcing
  • dropout
  • pretrained_emb

По умолчанию – {'embed_size':100, 'hidden_size':100, 'attention_size':100, 'teacher_forcing':1, 'dropout':0.1, 'pretrained_emb':False}.

monitor

valid_loss, accuracy, corpus_bleu и multi_label_fbeta.

MaskRCNN

(Выявление объектов)

box_batch_size_per_image

Положительные целые числа. Значение по умолчанию 512.

box_bg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_detections_per_img

Положительные целые числа. По умолчанию используется 100.

box_fg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_nms_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

box_positive_fraction

Значение с плавающей точкой от 0 до 1. По умолчанию – 0,25.

box_score_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,05.

rpn_batch_size_per_image

Положительные целые числа. Значение по умолчанию 256.

rpn_bg_iou_thresh

Значение с плавающей точкой от 0 до 1. По умолчанию 0,3.

rpn_fg_iou_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.

rpn_nms_thresh

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7.

rpn_positive_fraction

Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5.

rpn_post_nms_top_n_test

Положительные целые числа. Значение по умолчанию равно 1000.

rpn_post_nms_top_n_train

Положительные целые числа. Значение по умолчанию равно 2000.

rpn_pre_nms_top_n_test

Положительные целые числа. Значение по умолчанию равно 1000.

rpn_pre_nms_top_n_train

Положительные целые числа. Значение по умолчанию равно 2000.

MaXDeepLab

(общая сегментация)

n_masks

Положительные целые числа. Значение по умолчанию равно 30.

MMDetection

(выявление объектов)

chip_size

Целые числа от 0 до размера изображения.

model

atss, carafe, cascade_rcnn, cascade_rpn, dcn, deeplabv3, detectors, dino, double_heads, dynamic_rcnn, empirical_attention, fcos, foveabox, fsaf, ghm, hrnet, libra_rcnn, nas_fcos, pafpn, pisa, regnet, reppoints, res2net, sabl и vfnet.

По умолчанию – deeplabv3.

model_weight

true или false.

MMSegmentation

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

model

ann, apcnet, ccnet, cgnet, deeplabv3, deeplabv3plus, dmnet , dnlnet, emanet, fastscnn, fcn, gcnet, hrnet, mask2former, mobilenet_v2, nonlocal_net, ocrnet, prithvi100m, psanet, pspnet, resnest, sem_fpn, unet и upernet.

По умолчанию – mask2former.

model_weight

true или false.

Multi Task Road Extractor

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

gaussian_thresh

0.0 до 1.0. По умолчанию 0.76.

monitor

valid_loss, accuracy, miou и dice.

mtl_model

linknet или hourglass.

orient_bin_size

Положительное число. Значение по умолчанию равно 20.

orient_theta

Положительное число. Значение по умолчанию - 8.

Pix2Pix

(преобразование изображения)

perceptual_loss

true или false. По умолчанию – false.

Pix2PixHD

(преобразование изображения)

gen_network

local или global. По умолчанию – local.

feat_loss

true или false. По умолчанию – true.

lambda_feat

Положительные целые значения. Значение по умолчанию равно 10.

lambda_l1

Положительные целые значения. По умолчанию используется 100.

lsgan

true или false. По умолчанию – true.

n_blocks_global

Положительные целые значения. По умолчанию 9.

n_blocks_local

Положительные целые значения. Значение по умолчанию равно 3.

n_downsample_global

Положительные целые значения. Значение по умолчанию равно 4.

n_dscr

Положительные целые значения. Значение по умолчанию равно 2.

n_dscr_filters

Положительные целые значения. Значение по умолчанию - 64.

n_gen_filters

Положительные целые значения. Значение по умолчанию - 64.

n_layers_dscr

Положительные целые значения. Значение по умолчанию равно 3.

n_local_enhancers

Положительные целые значения. Значение по умолчанию равно 1.

norm

instance или batch. По умолчанию – instance.

vgg_loss

true или false. По умолчанию – true.

PSETAE

(классификация пикселов)

channels_of_interest

Список номеров каналов (положительные целые значения).

d_k

Положительные целые значения. Значение по умолчанию 32.

dropout

Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,2.

min_points

Целые числа, кратные 64.

mlp1

Список положительных целых чисел. По умолчанию – 32, 64.

mlp2

Список положительных целых чисел. По умолчанию – 128, 128.

mlp4

Список положительных целых чисел. По умолчанию – 64, 32.

n_head

Положительные целые значения. Значение по умолчанию равно 4.

pooling

mean, std, max или min.

T

Положительные целые значения. Значение по умолчанию равно 1000.

timesteps_of_interest

Список положительных целых чисел.

Pyramid Scene Parsing Network

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

class_balancing

true или false.

dice_loss_average

micro или macro. По умолчанию – micro.

dice_loss_fraction

Значение с плавающей точкой от 0 до 1. По умолчанию - 0.

focal_loss

true или false.

ignore_classes

Допустимые значения классов.

keep_dilation

true или false. По умолчанию – false.

monitor

valid_loss или accuracy.

mixup

true или false.

pointrend

true или false. По умолчанию – false.

pyramid_sizes

[уровень свертки 1, уровень свертки 2, ... , уровень свертки n]

use_net

true или false.

RetinaNet

(выявление объектов)

chip_size

Целые числа от 0 до размера изображения.

monitor

valid_loss или average_precision.

ratios

Значение отношения 1, значение отношения 2, значение отношения 3.

По умолчанию – 0.5,1,2.

scales

[значение шкалы 1, значение шкалы 2, значение шкалы 3]

По умолчанию – [1, 0.8, 0.63].

SAMLoRA

(классификация пикселов)

class_balancing

true или false.

ignore_classes

Допустимые значения классов.

Single Shot Detector

(выявление объектов)

backend

pytorch или tensorflow. По умолчанию – pytorch.

bias

Значение с плавающей точкой. Значение по умолчанию -0,4.

chip_size

Целые числа от 0 до размера изображения. По умолчанию 0,3.

drop

Значение с плавающей точкой от 0 до 1.

focal_loss

true или false. По умолчанию – false.

grids

Целочисленные значения больше 0.

location_loss_factor

Значение с плавающей точкой от 0 до 1.

monitor

valid_loss или average_precision.

ratios

[значение по горизонтали, значение по вертикали]

zooms

Значение увеличения, где 1.0 - отсутствие увеличения.

Super-resolution с опорной моделью SR3

(преобразование изображения)

attn_res

Целочисленные значения больше 0. По умолчанию это 16.

channel_mults

Наборы целочисленных множителей, по умолчанию это [1, 2, 4, 4, 8, 8].

downsample_factor

Положительные целые значения. Значение по умолчанию равно 4.

dropout

Значение с плавающей точкой. По умолчанию - 0.

inner_channel

Целочисленное значение больше 0. Значение по умолчанию - 64.

linear_start

Целочисленное значение времени. Значение по умолчанию 1e-02.

linear_end

Целочисленное значение времени. Значение по умолчанию 1e-06.

n_timestep 

Целочисленное значение больше 0. Значение по умолчанию равно 1000.

norm_groups

Целочисленное значение больше 0. Значение по умолчанию 32.

res_blocks

Целочисленное значение больше 0. Значение по умолчанию равно 3.

schedule 

linear, warmup10, warmup50, const, jsd, или cosine.

По умолчанию – linear.

Суперразрешение с опорной моделью SR3_UViT

(преобразование изображения)

depth

Положительное целое числовое значение. По умолчанию 17.

embed_dim

Положительные целые значения точек. По умолчанию 768.

mlp_ratio

Положительное значение с плавающей запятой. По умолчанию 4,0.

num_heads

Положительное целое числовое значение. Значение по умолчанию равно 12.

patch_size

Положительное целое числовое значение. По умолчанию это 16.

qkv_bias

true или false. По умолчанию – false.

U-Net

(классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

class_balancing

true или false.

dice_loss_average

micro или macro. По умолчанию – micro.

dice_loss_fraction

Значение с плавающей точкой от 0 до 1. По умолчанию - 0.

focal_loss

true или false.

ignore_classes

Допустимые значения классов.

monitor

valid_loss или accuracy.

mixup

true или false.

Выводящие аргументы

Следующие аргументы доступны для, контроля, как обучаются модели глубокого обучения для вывода. Информация из параметра Определение модели используется для заполнения параметра Аргументы в инструментах вывода. Аргументы различаются в зависимости от архитектуры модели. Предварительно обученные модели ArcGIS и пользовательские модели глубокого обучения могут включать дополнительные аргументы, которые поддерживаются инструментом.

АргументТип выводаКорректные значения

batch_size

Количество листов изображений, обработанных на каждом этапе построения модели. Оно зависит от объема памяти вашего графического адаптера. Аргумент доступен для всех архитектур моделей.

Классифицировать объекты

Классифицировать пикселы

Выявить изменения

Выявить объекты

Целочисленные значения больше 0; обычно целое число в степени 2n.

direction

Изображение передается из одного домена в другой. Более подробную информацию об этом аргументе см. в Как работает CycleGAN.

Аргумент доступен только для архитектуры CycleGAN.

Классифицировать пикселы

Доступными опциями являются AtoB и BtoA.

exclude_pad_detections

Если true, потенциально усеченные обнаружения вблизи краев, которые находятся в дополненной области кусочков изображений, будут фильтроваться.

Аргумент доступен только для SSD, RetinaNet, YOLOv3, DETReg, MMDetection и Faster RCNN.

Выявить объекты

true или false.

merge_policy

Политика объединения расширенных прогнозов. Это применимо только при использовании увеличения времени тестирования.

Для инструмента Классифицировать пикселы при помощи глубокого обучения аргумент доступен в арххитектурах MultiTaskRoadExtractor и ConnectNet. Если IsEdgeDetection присутствует в файле .emd модели, BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation также являются доступными архитектурами.

Для инструмента Выявить объекты при помощи глубокого обучения аргумент доступен только для MaskRCNN.

Классифицировать пикселы

Выявить объекты

Доступные опции mean, max и min.

nms_overlap

Коэффициент максимального перекрытия для двух перекрывающихся объектов, который определяется как отношение площади пересечения к площади объединения. Аргумент доступен для всех архитектур моделей.

Выявить объекты

Значение с плавающей точкой от 0.0 до 1.0. Значение по умолчанию равно 0.1.

output_classified_raster

Путь к выходному растру. Аргумент доступен только для MaXDeepLab.

Выявить объекты

Путь и имя файла для выходного классифицированного растра.

padding

Количество пикселов на границе листов изображений, из которых складываются прогнозные данные для смежных листов. Чтобы сгладить результат при уменьшении артефактов, увеличьте значение. Максимальное значение внутреннего отступа может составлять половину значения размера листа. Аргумент доступен для всех архитектур моделей.

Классифицировать пикселы

Выявить изменения

Выявить объекты

Целочисленные значения больше 0 и меньше, чем половина значения размера листа.

predict_background

Если значение True, класс фона также классифицируется. Аргумент доступен для UNET, PSPNET, DeepLab и MMSegmentation.

Классифицировать пикселы

true или false.

return_probability_raster

Если значение true, выходными данными будет растр вероятности. Растр вероятности — это растр, пикселы которого определяют вероятность того, что интересующая переменная находится выше или ниже указанного порогового значения.

Если ArcGISLearnVersion 1.8.4 или новее в файле .emd модели, доступны архитектуры MultiTaskRoadExtractor и ConnectNet. Если ArcGISLearnVersion 1.8.4 или новее и IsEdgeDetection есть в файле .emd модели, доступны архитектуры BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation.

Классифицировать пикселы

true или false.

score_threshold

Прогнозы выше этой оценки достоверности включаются в результат. Аргумент доступен для всех архитектур моделей.

Классифицировать объекты

От 0 до 1.0.

test_time_augmentation

Увеличивает время тестирования в процессе прогнозирования. Если задано значение true, то конечный результат объединит прогнозы перевернутых и повернутых вариантов входного изображения. Аргумент доступен для большинства архитектур моделей.

Классифицировать объекты

Классифицировать пикселы

true или false.

threshold

В результат включаются обнаруженные объекты, достоверность которых превышает это пороговое значение.

Для инструмента Классифицировать пикселы при помощи глубокого обучения, если ArcGISLearnVersion 1.8.4 или новее в файле .emd модели, доступны архитектуры MultiTaskRoadExtractor и ConnectNet. Если ArcGISLearnVersion 1.8.4 или новее и IsEdgeDetection есть в файле .emd модели, доступны архитектуры BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation.

Для инструмента Выявить объекты при помощи глубокого обучения этот агрумент доступен во всех архитектурах модели.

Классифицировать пикселы

Выявить объекты

от 0 до 1.0.

thinning

Делает тоньше или сокращает прогнозируемые ребра.

Если IsEdgeDetection присутствует в файле .emd модели, BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation также являются доступными архитектурами.

Классифицировать пикселы

true или false.

tile_size

tile_size - Ширина и высота листов изображений, на которые разбивается изображение для прогнозирования.

Для инструмента Классифицировать пикселы при помощи глубокого обучения, аргумент доступен только в архитектуре CycleGAN.

Для инструмента Выявить объекты при помощи глубокого обучения аргумент доступен только для MaskRCNN.

Классифицировать пикселы

Выявить объекты

Целочисленные значения больше 0 и меньше, чем половина значения размера изображения.

Связанные разделы