Доступно с лицензией Image Analyst.
Аргументы - один из вариантов управления способов обучения и использования моделей глубокого обучения. В данном разделе в первой таблице перечислены поддерживаемые аргументы модели для обучения моделей глубокого обучения. Во второй таблице перечислены аргументы, контролирующие, как модели глубокого обучения используются для вывода.
Обучающие аргументы
Инструмент Тренировать модель глубокого обучения включает аргументы для обучения моделей глубокого обучения. Аргументы различаются в зависимости от архитектуры модели. Вы можете менять значения этих аргументов для обучения моделей. Аргументы следующие:
- attention_type — определяет тип модуля. По умолчанию – PAM.
- attn_res — Количество рассмотрений в остаточных блоках. Это дополнительное целочисленное значение, по умолчанию равное 16. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
- backend — Управляет внутренней средой, которая будет использоваться для этой модели. Чтобы использовать Tensorflow, переключитесь на тип процессора CPU. По умолчанию – pytorch.
- bias — Смещение для головного элемента Single Shot Detector (SSD). Значение по умолчанию -0,4.
- box_batch_size_per_image — Количество предложений, которые выбираются во время обучения классификации. Значение по умолчанию 512.
- box_bg_iou_thresh — Максимальное пересечение объединения (IoU) между предложениями и (истинным) блоком GT, чтобы их можно было считать отрицательными во время обучения головного элемента классификации. Значение по умолчанию равно 0.5.
- box_detections_per_img — Максимальное количество обнаружений на изображение для всех классов. По умолчанию используется 100.
- box_fg_iou_thresh — Минимальный IoU между предложениями и блоком GT, чтобы их можно было считать положительными во время обучения головного элемента классификации. Значение по умолчанию равно 0.5.
- box_nms_thresh — Порог не максимального подавления (NMS) для головного элемента прогнозирования; используется во время вывода. Значение по умолчанию равно 0.5.
- box_positive_fraction — Доля положительных предложений в мини-пакете во время обучения головного элемента классификации. По умолчанию – 0,25.
- box_score_thresh — Порог оценки классификации, который должен быть достигнут для возврата предложений во время вывода. По умолчанию 0,05.
- channel_mults — дополнительные множители глубины для последующих разрешений в U-Net. По умолчанию это 1, 2, 4, 4, 8, 8. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
- channels_of_interest — Список интересующих спектральных диапазонов (каналов). Фильтрует каналы растров разновременных временных рядов на основе этого списка. Например, если в нашем наборе данных есть каналы 0–4, а обучение будет использовать только каналы 0,1 и 2, список будет [0,1,2].
- chip_size — Размер изображения, которое будет использоваться для обучения модели. Изображения будут обрезаны до указанного размера чипа.
- class_balancing — указывает, будет ли обратная кросс-энтропийная потеря сбалансирована с частотой пикселов на класс. По умолчанию – False.
- d_k — Измерение векторов ключа и запроса. Значение по умолчанию 32.
- decode_params — словарь, который определяет, как будет работать Image captioner. Он состоит из следующих параметров: embed_size, hidden_size, attention_size, teacher_forcing, dropout и pretrained_emb. teacher_forcing — вероятность усиления учителем. Teacher forcing — это стратегия обучения рекуррентных нейронных сетей. Она использует выходные данные модели из предыдущего временного шага в качестве входных данных вместо предыдущих выходных данных во время обратной передачи ошибки обучения. pretrained_emb указывает, будет ли использоваться предварительно обученное встраивание текста. Если True, будет использоваться быстрое встраивание текста. Если False, предварительно обученное встраивание текста не будет использоваться.
- depth — Глубина модели. По умолчанию 17.
- dice_loss_average — Выберите, использовать ли микро или макроусреднение. Макроусреднение вычислит метрику независимо для каждого класса, а затем возьмет среднее, тем самым обрабатывая все классы одинаково). Микроусреднение объединит вклады всех классов для вычисления средней метрики. В настройке многоклассовой классификации микроусреднение предпочтительнее, если вы предполагаете дисбаланс классов, когда образцов одного класса намного больше, чем других классов. По умолчанию – micro.
- dice_loss_fraction — Используется для корректировки веса потерь по умолчанию (или фокусных потерь) по сравнению с разделенными потерями в общих потерях для управления обучением. По умолчанию - 0. Если focal_loss задано как true, вместо потерь по умолчанию используются фокусные потери. Если dice_loss_fraction задано как 0, обучение будет использовать значение потерь по умолчанию (либо фокальную потерю) в качестве общей потери для управления обучением. Если dice_loss больше 0, обучение будет использовать формулу для вычисления общей потери для управления обучением:
=(1 – dice_loss_fraction)*default_loss + dice_loss_fraction*dice_loss
- downsample_factor — Фактор для понижения разрешения изображений. Значение по умолчанию равно 4.
- drop — Вероятность прореживания. Чтобы снизить переобучение, увеличьте это значение. По умолчанию 0,3.
- dropout — Вероятность прореживания. Чтобы снизить переобучение, увеличьте это значение. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
- embed_dim — Измерение вставок. По умолчанию 768.
- feat_loss — Указывает, использовать ли дискриминаторную потерю сопоставления объектов. По умолчанию – True.
- focal_loss — указывает, будут ли использоваться фокальные потери. По умолчанию – False.
- gaussian_thresh — порог Гаусса, который задает требуемую ширину дороги. Допустимый диапазон от 0.0 до 1.0. По умолчанию 0.76.
- gen_blocks — Количество блоков ResNet для использования в генераторе. По умолчанию 9.
- gen_network — Выберите модель для использования в генераторе. Используйте global, если мало памяти графического процессора. По умолчанию – local.
- grids — количество сеток, на которые будет разбито изображение для обработки. Например, значение аргумента равным 4 означает, что изображение будет разделено на 16 ячеек (4 x 4). Если значение не задано, оптимальное значение сетки будет рассчитано на основе входных изображений.
- ignore_classes – список значений классов, при которых в модели не будет потерь.
- inner_channel – измерение первого слоя U-net. Это необязательное целочисленное значение. Значение по умолчанию - 64. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
- keep_dilation — Укажите, использовать ли keep_dilation. Если установлено значение True и используется архитектура pointrend, это может потенциально улучшить точность за счет потребления памяти. По умолчанию – False.
- lambda_feat — Вес потерь сопоставления объектов. Значение по умолчанию равно 10.
- lambda_l1 — Вес потерь сопоставления объектов. По умолчанию используется 100. Не поддерживается для 3-канальных изображений.
- linear_end — необязательное целое число для планирования окончания. Значение по умолчанию 1e-06. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
- linear_start — необязательное целое число для планирования запуска. Значение по умолчанию 1e-02. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
- lsgan — Указывает, использовать ли среднеквадратичную ошибку в обучении. Если задано False, будет использоваться двоичная перекрестная энтропия. По умолчанию – True.
- location_loss_factor — Задает вес потерь ограничивающего прямоугольника. Этот фактор регулирует фокус модели на местоположении ограничивающего прямоугольника. Если задано значение None, вес потерь местоположения и потерь классификации будет одинаковым.
- min_points— Количество пикселов для выборки из каждой маскированной области обучения; это значение должно быть кратно 64.
- mixup — Выберите, использовать ли mixup. Если установлено значение True, то создаются новые обучающие изображения путем случайного смешивания обучающих изображений. По умолчанию – False.
- mlp_ratio — Соотношение многослойного персептрона (MLP). Значение по умолчанию равно 4.
- mlp1 — Измерения последовательных пространств объектов MLP1. По умолчанию – 32,64.
- mlp2 — Размеры последовательных пространств объектов MLP2. По умолчанию – 128,128.
- mlp4 — Размеры декодера MLP. По умолчанию – 64,32.
- model — опорная модель, используемая для обучения модели. Доступные опорные модели зависят от значения параметра Тип модели. Этот аргумент поддерживается только для типов модели MMDetection и MMSegmentation. Значение по умолчанию для MMDetection — cascade_rcnn. Значение по умолчанию для MMSegmentation — mask2former.
- model_weight — определяет, использовать ли веса предварительно обученной модели. По умолчанию – False. Значением также может быть путь к файлу конфигурации, содержащему веса модели из репозитория MMDetection или репозитория MMSegmentation.
- monitor — указывает, какую метрику следует отслеживать во время проверки и ранней остановки. Доступные метрики зависят от значения параметра Тип модели. По умолчанию – valid_loss.
- mtl_model — задает тип архитектуры, который будет использоваться для создания модели. Возможные варианты linknet или hourglass для нейронных архитектур на основе linknet или hourglass соответственно. По умолчанию – hourglass.
- n_blocks_global — Количество остаточных блоков в глобальной сети генератора. По умолчанию 9.
- n_blocks_local — Количество остаточных блоков в локальной сети усилителя. Значение по умолчанию равно 3.
- n_downsample_global — Количество слоев понижения частоты дискретизации в глобальной сети генератора.
- n_dscr — Количество используемых дискриминаторов. Значение по умолчанию равно 2.
- n_dscr_filters — Количество фильтров дискриминатора в первом уровне свертки. Значение по умолчанию - 64.
- n_gen_filters — Количество фильтров gen в первом уровне свертки. Значение по умолчанию - 64.
- n_head — Количество заголовков прерывания. Значение по умолчанию равно 4.
- n_layers_dscr — Количество уровней для сети дискриминатора, используемой в Pix2PixHD. Значение по умолчанию равно 3.
- n_local_enhancers — Количество используемых локальных усилителей. Значение по умолчанию равно 1.
- n_masks — Представляет максимальное количество надписей классов и экземпляров, которые может содержать любое изображение. Значение по умолчанию равно 30.
- n_timestep — необязательное значение для количества временных шагов диффузии. Значение по умолчанию равно 1000. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
- norm — Указывает, использовать ли нормализацию экземпляров или пакетную нормализацию. По умолчанию – instance.
- norm_groups — количество групп для нормирования групп. Это необязательное целочисленное значение. Значение по умолчанию 32. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
- num_heads — Количество заголовков прерывания. Значение по умолчанию равно 12.
- orient_bin_size — размер бина для углов ориентации. Значение по умолчанию равно 20.
- orient_theta — ширина маски ориентации. Значение по умолчанию - 8.
- oversample — Указывает, использовать ли избыточную выборку. Если задано значение True, он избыточно выбирает несбалансированные классы набора данных во время обучения. Это не поддерживается с наборами данных MultiLabel. По умолчанию – False.
- patch_size — Размер патча для генерации внедрений патча. Значение по умолчанию 16.
- perceptual_loss — Указывает, использовать ли перцептуальную потерю в обучении. По умолчанию – False.
- pointrend — Указывает, использовать ли архитектуру PointRend поверх заголовка сегментации. Для получения дополнительной информации об архитектуре PointRend см. PointRend PDF. По умолчанию – False.
- pooling — Стратегия объединения пикселов с внедрением, которую следует использовать. Значение по умолчанию mean
- pyramid_sizes — количество и размер слоев свертки, которые должны применяться к различным субрегионам. По умолчанию [1,2,3,6]. Аргумент относится к модели Pyramid Scene Parsing Network.
- qkv_bias — Указывает, использовать ли смещение вектора QK при обучении. По умолчанию – False.
- ratios — список отношений сторон, используемых для рамок привязки. При обнаружении объекта рамка привязки представляет идеальное местоположение, форму и размер прогнозируемого объекта. Например, задание для этого аргумента [1.0,1.0], [1.0, 0.5] означает, что рамка якоря - это квадрат (1:1) или прямоугольник, горизонтальная сторона которого в два раза меньше вертикальной (1:0.5). По умолчанию для RetinaNet – [0.5,1,2]. По умолчанию для Single Shot Detector – [1.0, 1.0].
- res_blocks — количество остаточных блоков. Это необязательное целочисленное значение. Значение по умолчанию равно 3. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
- rpn_batch_size_per_image — Количество якорей, которые выбираются во время обучения RPN для вычисления потерь. Значение по умолчанию 256.
- rpn_bg_iou_thresh — Максимальный IoU между якорем и блоком GT, чтобы их можно было считать отрицательными во время обучения RPN. По умолчанию 0,3.
- rpn_fg_iou_thresh — Минимальный IoU между якорем и блоком GT, чтобы их можно было считать положительными во время обучения RPN. Значение по умолчанию 0,7.
- rpn_nms_thresh — Порог NMS, используемый для постобработки предложений RPN. Значение по умолчанию 0,7.
- rpn_positive_fraction — Доля положительных якорей в мини-пакете во время обучения RPN. Значение по умолчанию равно 0.5.
- rpn_post_nms_top_n_test — Количество предложений, которые нужно сохранить после применения NMS во время тестирования. Значение по умолчанию равно 1000.
- rpn_post_nms_top_n_train — Количество предложений, которые нужно сохранить после применения NMS во время обучения. Значение по умолчанию равно 2000.
- rpn_pre_nms_top_n_test — Количество предложений, которые нужно сохранить до применения NMS во время тестирования. Значение по умолчанию равно 1000.
- rpn_pre_nms_top_n_train — Количество предложений, которые нужно сохранить до применения NMS во время обучения. Значение по умолчанию равно 2000.
- scales — количество уровней масштабирования, на которые каждая ячейка будет увеличена или уменьшена. По умолчанию [1, 0.8, 0.63].
- schedule — Необязательный аргумент для установки типа используемого расписания. Варианты: linear, warmup10, warmup50, const, jsd и cosine. Значением по умолчанию является Линейная. Этот аргумент поддерживается только в том случае, если значение параметра Опорная модель равно SR3.
- T — Период, который нужно использовать для позиционного кодирования. Значение по умолчанию равно 1000.
- timesteps_of_interest — Список интересующих временных шагов; это отфильтрует разновременные временные ряды на основе списка указанных временных шагов. Например, если набор данных имеет связующие шаги 0, 1, 2 и 3, но в обучении используются только временные шаги 0, 1 и 2, этот параметр будет задан как [0,1,2]; the rest of the time-steps will be filtered out.
- use_net – Задает, будет ли использоваться декодер U-Net для восстановления данных после завершения формирования пирамидного пула. По умолчанию – True. Аргумент относится к модели Pyramid Scene Parsing Network.
- vgg_loss — Укажите, следует ли использовать потерю соответствия объектов VGG. Поддерживается только для 3-канальных изображений. По умолчанию – True.
- zooms — количество уровней масштабирования, на которое каждая ячейка сетки будет увеличена или уменьшена. Установка для этого аргумента значения 1 означает, что все ячейки сетки останутся в том же размере или уровне масштабирования. Уровень масштабирования 2 означает, что все ячейки сетки станут в два раза больше (увеличены на 100 процентов). Предоставление списка уровней масштабирования означает, что все ячейки сетки будут масштабироваться с использованием всех значений в списке. Значение по умолчанию равно 1.
Тип модели | Аргумент | Корректные значения |
---|---|---|
Изменить детектор (классификация пикселов) | attention_type | PAM (Pyramid Attention Module) или BAM (Basic Attention Module). По умолчанию – PAM. |
chip_size | Целые числа от 0 до размера изображения. | |
monitor | valid_loss, precision, recall и f1. | |
ConnectNet (классификация пикселов) | chip_size | Целые числа от 0 до размера изображения. |
gaussian_thresh | 0.0 до 1.0. По умолчанию 0.76. | |
monitor | valid_loss, accuracy, miou и dice. | |
mtl_model | linknet или hourglass. | |
orient_bin_size | Положительное число. Значение по умолчанию равно 20. | |
orient_theta | Положительное число. Значение по умолчанию - 8. | |
CycleGAN (преобразование изображения) | gen_blocks | Положительное целое число. Значение по умолчанию 9. |
lsgan | true или false. По умолчанию – true. | |
DeepLabv (классификация пикселов) | chip_size | Целые числа от 0 до размера изображения. |
class_balancing | true или false. | |
dice_loss_average | micro или macro. По умолчанию – micro. | |
dice_loss_fraction | Значение с плавающей точкой от 0 до 1. По умолчанию - 0. | |
focal_loss | true или false. | |
ignore_classes | Допустимые значения классов. | |
keep_dilation | true или false. По умолчанию – false. | |
mixup | true или false. | |
monitor | valid_loss и accuracy. | |
pointrend | true или false. По умолчанию – false. | |
FasterRCNN (Выявление объектов) | box_batch_size_per_image | Положительные целые числа. Значение по умолчанию 512. |
box_bg_iou_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5. | |
box_detections_per_img | Положительные целые числа. По умолчанию используется 100. | |
box_fg_iou_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5. | |
box_nms_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5. | |
box_positive_fraction | Значение с плавающей точкой от 0 до 1. По умолчанию – 0,25. | |
box_score_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,05. | |
rpn_batch_size_per_image | Положительные целые числа. Значение по умолчанию 256. | |
rpn_bg_iou_thresh | Значение с плавающей точкой от 0 до 1. По умолчанию 0,3. | |
rpn_fg_iou_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7. | |
rpn_nms_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7. | |
rpn_positive_fraction | Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5. | |
rpn_post_nms_top_n_test | Положительные целые числа. Значение по умолчанию равно 1000. | |
rpn_post_nms_top_n_train | Положительные целые числа. Значение по умолчанию равно 2000. | |
rpn_pre_nms_top_n_test | Положительные целые числа. Значение по умолчанию равно 1000. | |
rpn_pre_nms_top_n_train | Положительные целые числа. Значение по умолчанию равно 2000. | |
Feature Classifier (Классификация объектов) | backend | pytorch или tensorflow. По умолчанию – pytorch. |
mixup | true или false. По умолчанию – false. | |
oversample | true или false. По умолчанию – false. | |
Image captioner (преобразование изображения) | chip_size | Целые числа от 0 до размера изображения. |
Аргумент decode_params состоит из следующих шести параметров:
| По умолчанию – {'embed_size':100, 'hidden_size':100, 'attention_size':100, 'teacher_forcing':1, 'dropout':0.1, 'pretrained_emb':False}. | |
monitor | valid_loss, accuracy, corpus_bleu и multi_label_fbeta. | |
MaskRCNN (Выявление объектов) | box_batch_size_per_image | Положительные целые числа. Значение по умолчанию 512. |
box_bg_iou_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5. | |
box_detections_per_img | Положительные целые числа. По умолчанию используется 100. | |
box_fg_iou_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5. | |
box_nms_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5. | |
box_positive_fraction | Значение с плавающей точкой от 0 до 1. По умолчанию – 0,25. | |
box_score_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,05. | |
rpn_batch_size_per_image | Положительные целые числа. Значение по умолчанию 256. | |
rpn_bg_iou_thresh | Значение с плавающей точкой от 0 до 1. По умолчанию 0,3. | |
rpn_fg_iou_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7. | |
rpn_nms_thresh | Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,7. | |
rpn_positive_fraction | Значение с плавающей точкой от 0 до 1. Значение по умолчанию равно 0.5. | |
rpn_post_nms_top_n_test | Положительные целые числа. Значение по умолчанию равно 1000. | |
rpn_post_nms_top_n_train | Положительные целые числа. Значение по умолчанию равно 2000. | |
rpn_pre_nms_top_n_test | Положительные целые числа. Значение по умолчанию равно 1000. | |
rpn_pre_nms_top_n_train | Положительные целые числа. Значение по умолчанию равно 2000. | |
MaXDeepLab (общая сегментация) | n_masks | Положительные целые числа. Значение по умолчанию равно 30. |
MMDetection (выявление объектов) | chip_size | Целые числа от 0 до размера изображения. |
model | atss, carafe, cascade_rcnn, cascade_rpn, dcn, deeplabv3, detectors, dino, double_heads, dynamic_rcnn, empirical_attention, fcos, foveabox, fsaf, ghm, hrnet, libra_rcnn, nas_fcos, pafpn, pisa, regnet, reppoints, res2net, sabl и vfnet. По умолчанию – deeplabv3. | |
model_weight | true или false. | |
MMSegmentation (классификация пикселов) | chip_size | Целые числа от 0 до размера изображения. |
model | ann, apcnet, ccnet, cgnet, deeplabv3, deeplabv3plus, dmnet , dnlnet, emanet, fastscnn, fcn, gcnet, hrnet, mask2former, mobilenet_v2, nonlocal_net, ocrnet, prithvi100m, psanet, pspnet, resnest, sem_fpn, unet и upernet. По умолчанию – mask2former. | |
model_weight | true или false. | |
Multi Task Road Extractor (классификация пикселов) | chip_size | Целые числа от 0 до размера изображения. |
gaussian_thresh | 0.0 до 1.0. По умолчанию 0.76. | |
monitor | valid_loss, accuracy, miou и dice. | |
mtl_model | linknet или hourglass. | |
orient_bin_size | Положительное число. Значение по умолчанию равно 20. | |
orient_theta | Положительное число. Значение по умолчанию - 8. | |
Pix2Pix (преобразование изображения) | perceptual_loss | true или false. По умолчанию – false. |
Pix2PixHD (преобразование изображения) | gen_network | local или global. По умолчанию – local. |
feat_loss | true или false. По умолчанию – true. | |
lambda_feat | Положительные целые значения. Значение по умолчанию равно 10. | |
lambda_l1 | Положительные целые значения. По умолчанию используется 100. | |
lsgan | true или false. По умолчанию – true. | |
n_blocks_global | Положительные целые значения. По умолчанию 9. | |
n_blocks_local | Положительные целые значения. Значение по умолчанию равно 3. | |
n_downsample_global | Положительные целые значения. Значение по умолчанию равно 4. | |
n_dscr | Положительные целые значения. Значение по умолчанию равно 2. | |
n_dscr_filters | Положительные целые значения. Значение по умолчанию - 64. | |
n_gen_filters | Положительные целые значения. Значение по умолчанию - 64. | |
n_layers_dscr | Положительные целые значения. Значение по умолчанию равно 3. | |
n_local_enhancers | Положительные целые значения. Значение по умолчанию равно 1. | |
norm | instance или batch. По умолчанию – instance. | |
vgg_loss | true или false. По умолчанию – true. | |
PSETAE (классификация пикселов) | channels_of_interest | Список номеров каналов (положительные целые значения). |
d_k | Положительные целые значения. Значение по умолчанию 32. | |
dropout | Значение с плавающей точкой от 0 до 1. Значение по умолчанию 0,2. | |
min_points | Целые числа, кратные 64. | |
mlp1 | Список положительных целых чисел. По умолчанию – 32, 64. | |
mlp2 | Список положительных целых чисел. По умолчанию – 128, 128. | |
mlp4 | Список положительных целых чисел. По умолчанию – 64, 32. | |
n_head | Положительные целые значения. Значение по умолчанию равно 4. | |
pooling | mean, std, max или min. | |
T | Положительные целые значения. Значение по умолчанию равно 1000. | |
timesteps_of_interest | Список положительных целых чисел. | |
Pyramid Scene Parsing Network (классификация пикселов) | chip_size | Целые числа от 0 до размера изображения. |
class_balancing | true или false. | |
dice_loss_average | micro или macro. По умолчанию – micro. | |
dice_loss_fraction | Значение с плавающей точкой от 0 до 1. По умолчанию - 0. | |
focal_loss | true или false. | |
ignore_classes | Допустимые значения классов. | |
keep_dilation | true или false. По умолчанию – false. | |
monitor | valid_loss или accuracy. | |
mixup | true или false. | |
pointrend | true или false. По умолчанию – false. | |
pyramid_sizes | [уровень свертки 1, уровень свертки 2, ... , уровень свертки n] | |
use_net | true или false. | |
RetinaNet (выявление объектов) | chip_size | Целые числа от 0 до размера изображения. |
monitor | valid_loss или average_precision. | |
ratios | Значение отношения 1, значение отношения 2, значение отношения 3. По умолчанию – 0.5,1,2. | |
scales | [значение шкалы 1, значение шкалы 2, значение шкалы 3] По умолчанию – [1, 0.8, 0.63]. | |
SAMLoRA (классификация пикселов) | class_balancing | true или false. |
ignore_classes | Допустимые значения классов. | |
Single Shot Detector (выявление объектов) | backend | pytorch или tensorflow. По умолчанию – pytorch. |
bias | Значение с плавающей точкой. Значение по умолчанию -0,4. | |
chip_size | Целые числа от 0 до размера изображения. По умолчанию 0,3. | |
drop | Значение с плавающей точкой от 0 до 1. | |
focal_loss | true или false. По умолчанию – false. | |
grids | Целочисленные значения больше 0. | |
location_loss_factor | Значение с плавающей точкой от 0 до 1. | |
monitor | valid_loss или average_precision. | |
ratios | [значение по горизонтали, значение по вертикали] | |
zooms | Значение увеличения, где 1.0 - отсутствие увеличения. | |
Super-resolution с опорной моделью SR3 (преобразование изображения) | attn_res | Целочисленные значения больше 0. По умолчанию это 16. |
channel_mults | Наборы целочисленных множителей, по умолчанию это [1, 2, 4, 4, 8, 8]. | |
downsample_factor | Положительные целые значения. Значение по умолчанию равно 4. | |
dropout | Значение с плавающей точкой. По умолчанию - 0. | |
inner_channel | Целочисленное значение больше 0. Значение по умолчанию - 64. | |
linear_start | Целочисленное значение времени. Значение по умолчанию 1e-02. | |
linear_end | Целочисленное значение времени. Значение по умолчанию 1e-06. | |
n_timestep | Целочисленное значение больше 0. Значение по умолчанию равно 1000. | |
norm_groups | Целочисленное значение больше 0. Значение по умолчанию 32. | |
res_blocks | Целочисленное значение больше 0. Значение по умолчанию равно 3. | |
schedule | linear, warmup10, warmup50, const, jsd, или cosine. По умолчанию – linear. | |
Суперразрешение с опорной моделью SR3_UViT (преобразование изображения) | depth | Положительное целое числовое значение. По умолчанию 17. |
embed_dim | Положительные целые значения точек. По умолчанию 768. | |
mlp_ratio | Положительное значение с плавающей запятой. По умолчанию 4,0. | |
num_heads | Положительное целое числовое значение. Значение по умолчанию равно 12. | |
patch_size | Положительное целое числовое значение. По умолчанию это 16. | |
qkv_bias | true или false. По умолчанию – false. | |
U-Net (классификация пикселов) | chip_size | Целые числа от 0 до размера изображения. |
class_balancing | true или false. | |
dice_loss_average | micro или macro. По умолчанию – micro. | |
dice_loss_fraction | Значение с плавающей точкой от 0 до 1. По умолчанию - 0. | |
focal_loss | true или false. | |
ignore_classes | Допустимые значения классов. | |
monitor | valid_loss или accuracy. | |
mixup | true или false. |
Выводящие аргументы
Следующие аргументы доступны для, контроля, как обучаются модели глубокого обучения для вывода. Информация из параметра Определение модели используется для заполнения параметра Аргументы в инструментах вывода. Аргументы различаются в зависимости от архитектуры модели. Предварительно обученные модели ArcGIS и пользовательские модели глубокого обучения могут включать дополнительные аргументы, которые поддерживаются инструментом.
Аргумент | Тип вывода | Корректные значения | |
---|---|---|---|
batch_size | Количество листов изображений, обработанных на каждом этапе построения модели. Оно зависит от объема памяти вашего графического адаптера. Аргумент доступен для всех архитектур моделей. | Классифицировать объекты Классифицировать пикселы Выявить изменения Выявить объекты | Целочисленные значения больше 0; обычно целое число в степени 2n. |
direction | Изображение передается из одного домена в другой. Более подробную информацию об этом аргументе см. в Как работает CycleGAN. Аргумент доступен только для архитектуры CycleGAN. | Классифицировать пикселы | Доступными опциями являются AtoB и BtoA. |
exclude_pad_detections | Если true, потенциально усеченные обнаружения вблизи краев, которые находятся в дополненной области кусочков изображений, будут фильтроваться. Аргумент доступен только для SSD, RetinaNet, YOLOv3, DETReg, MMDetection и Faster RCNN. | Выявить объекты | true или false. |
merge_policy | Политика объединения расширенных прогнозов. Это применимо только при использовании увеличения времени тестирования. Для инструмента Классифицировать пикселы при помощи глубокого обучения аргумент доступен в арххитектурах MultiTaskRoadExtractor и ConnectNet. Если IsEdgeDetection присутствует в файле .emd модели, BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation также являются доступными архитектурами. Для инструмента Выявить объекты при помощи глубокого обучения аргумент доступен только для MaskRCNN. | Классифицировать пикселы Выявить объекты | Доступные опции mean, max и min. |
nms_overlap | Коэффициент максимального перекрытия для двух перекрывающихся объектов, который определяется как отношение площади пересечения к площади объединения. Аргумент доступен для всех архитектур моделей. | Выявить объекты | Значение с плавающей точкой от 0.0 до 1.0. Значение по умолчанию равно 0.1. |
output_classified_raster | Путь к выходному растру. Аргумент доступен только для MaXDeepLab. | Выявить объекты | Путь и имя файла для выходного классифицированного растра. |
padding | Количество пикселов на границе листов изображений, из которых складываются прогнозные данные для смежных листов. Чтобы сгладить результат при уменьшении артефактов, увеличьте значение. Максимальное значение внутреннего отступа может составлять половину значения размера листа. Аргумент доступен для всех архитектур моделей. | Классифицировать пикселы Выявить изменения Выявить объекты | Целочисленные значения больше 0 и меньше, чем половина значения размера листа. |
predict_background | Если значение True, класс фона также классифицируется. Аргумент доступен для UNET, PSPNET, DeepLab и MMSegmentation. | Классифицировать пикселы | true или false. |
return_probability_raster | Если значение true, выходными данными будет растр вероятности. Растр вероятности — это растр, пикселы которого определяют вероятность того, что интересующая переменная находится выше или ниже указанного порогового значения. Если ArcGISLearnVersion 1.8.4 или новее в файле .emd модели, доступны архитектуры MultiTaskRoadExtractor и ConnectNet. Если ArcGISLearnVersion 1.8.4 или новее и IsEdgeDetection есть в файле .emd модели, доступны архитектуры BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation. | Классифицировать пикселы | true или false. |
score_threshold | Прогнозы выше этой оценки достоверности включаются в результат. Аргумент доступен для всех архитектур моделей. | Классифицировать объекты | От 0 до 1.0. |
test_time_augmentation | Увеличивает время тестирования в процессе прогнозирования. Если задано значение true, то конечный результат объединит прогнозы перевернутых и повернутых вариантов входного изображения. Аргумент доступен для большинства архитектур моделей. | Классифицировать объекты Классифицировать пикселы | true или false. |
threshold | В результат включаются обнаруженные объекты, достоверность которых превышает это пороговое значение. Для инструмента Классифицировать пикселы при помощи глубокого обучения, если ArcGISLearnVersion 1.8.4 или новее в файле .emd модели, доступны архитектуры MultiTaskRoadExtractor и ConnectNet. Если ArcGISLearnVersion 1.8.4 или новее и IsEdgeDetection есть в файле .emd модели, доступны архитектуры BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation. Для инструмента Выявить объекты при помощи глубокого обучения этот агрумент доступен во всех архитектурах модели. | Классифицировать пикселы Выявить объекты | от 0 до 1.0. |
thinning | Делает тоньше или сокращает прогнозируемые ребра. Если IsEdgeDetection присутствует в файле .emd модели, BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation также являются доступными архитектурами. | Классифицировать пикселы | true или false. |
tile_size | tile_size - Ширина и высота листов изображений, на которые разбивается изображение для прогнозирования. Для инструмента Классифицировать пикселы при помощи глубокого обучения, аргумент доступен только в архитектуре CycleGAN. Для инструмента Выявить объекты при помощи глубокого обучения аргумент доступен только для MaskRCNN. | Классифицировать пикселы Выявить объекты | Целочисленные значения больше 0 и меньше, чем половина значения размера изображения. |