获得 Image Analyst 许可后可用。
参数是控制如何训练和使用深度学习模型的多种方法之一。 在此主题中,第一个表列出了训练深度学习模型支持的模型参数。 第二个表列出了控制如何使用深度学习模型进行推断的参数。
训练参数
训练深度学习模型工具包括训练深度学习模型的参数。 这些参数将有所不同,具体取决于模型架构。 可以更改这些参数的值来训练模型。 参数如下:
- attention_type - 指定模块类型。 默认值为 PAM。
- attn_res - 残差块中的注意力数。 这是一个可选的整数值;默认值为 16。 仅当骨干模型参数值为 SR3 时,才支持此参数。
- backend - 控制此模型使用的后端框架。 要使用 Tensorflow,请将处理器类型切换为 CPU。 默认值为 pytorch。
- bias - 单帧检测器 (SSD) 头的偏差。 默认值为 -0.4。
- box_batch_size_per_image - 分类训练期间抽样的提议数量。 默认值为 512。
- box_bg_iou_thresh - 提议和(实际地表)GT 框之间的最大交并比 (IoU),以便在分类中心词训练期间将它们视为负数。 默认值为 0.5。
- box_detections_per_img - 针对所有类别,每个图像的最大检测次数。 默认值为 100。
- box_fg_iou_thresh - 提议和 GT 框之间的最小 IoU,以便在分类中心词训练期间将它们视为正数。 默认值为 0.5。
- box_nms_thresh - 预测中心词的非最大抑制 (NMS) 阈值;在推理期间使用。 默认值为 0.5。
- box_positive_fraction - 分类中心词训练期间小批量中正向提议的比例。 默认值为 0.25。
- box_score_thresh - 为了在推理过程中返回提议必须满足的分类分数阈值。 默认值为 0.05。
- channel_mults - U-Net 中适用于后续解析的可选深度乘数。 默认值为 1, 2, 4, 4, 8, 8。 仅当骨干模型参数值为 SR3 时,才支持此参数。
- channels_of_interest - 感兴趣的光谱带(通道)列表。 这将根据此列表从多时间序列的栅格中过滤出波段。 例如,如果我们的数据集中有 0-4 波段,但训练只使用 0、1 和 2 波段,则列表将是 [0,1,2]。
- chip_size - 用于训练模型的图像的大小。 影像将裁剪为指定的影像片大小。
- class_balancing - 指定是否平衡与每类像素的频率成反比的交叉熵损失。 默认值为 False。
- d_k - 键和查询向量的维度。 默认值为 32。
- decode_params - 一种用于控制图像标题生成器运行方式的字典。 它由以下参数组成:embed_size、hidden_size、attention_size、teacher_forcing、dropout 和 pretrained_emb。 teacher_forcing 是教师强制的概率。 教师强制是一种用于训练递归神经网络的策略。 该策略可在反向传播过程中将先前时间步长的模型输出用作输入而非先前的输出。 pretrained_emb 指定是否将使用预训练文本嵌入。 如果为 True,则它将使用快速文本嵌入。 如果为 False,则它将不使用预训练文本嵌入。
- depth - 模型深度。 默认值是 17。
- dice_loss_average - 选择使用微平均还是宏平均。 宏平均值将独立计算每个类别的度量,然后取平均值,从而平等对待所有类别)。 微平均将汇总所有类别的贡献来计算平均指标。 在多类分类设置中,如果您怀疑可能存在类别不平衡,即一个类别的样本比其他类别的样本多得多,则微平均是更好的选择。 默认值为 micro。
- dice_loss_fraction - 用于调整默认损失(或焦点损失)相对于骰子损失的权重,在总损失中指导训练。 默认值为 0。 如果 focal_loss 设置为 true,则使用焦点损失代替默认损失。 如果 dice_loss_fraction 设置为 0,训练将使用默认损失(或焦点损失)作为总损失来指导训练。 如果 dice_loss 分数大于 0,训练将使用一个公式作为总损失来指导训练:
=(1 – dice_loss_fraction)*default_loss + dice_loss_fraction*dice_loss
- downsample_factor - 对图像进行下采样的因素。 默认值为 4。
- drop - dropout 概率。 为了减少过度拟合,请增加该值。 默认值为 0.3。
- dropout - dropout 概率。 为了减少过度拟合,请增加该值。 仅当骨干模型参数值为 SR3 时,才支持此参数。
- embed_dim - 嵌入的维度。 默认值是 768。
- feat_loss - 指定是否使用鉴别器要素匹配损失。 默认值为 True。
- focal_loss - 指定是否使用焦点损失。 默认值为 False。
- gaussian_thresh - 高斯阈值,用于设置所需的道路宽度。 有效范围是 0.0 至 1.0。 默认值为 0.76。
- gen_blocks - 生成器中使用的 ResNet 块的数量。 默认值为 9。
- gen_network - 选择生成器使用的模型。 如果机器的 GPU 内存较低则使用 global。 默认值为 local。
- grids - 为进行处理将图像分割成的格网数。 例如,将此参数设置为 4 意味着影像将划分为 4 x 4 或 16 个格网像元。 如果未指定任何值,则将根据输入影像计算最佳格网值。
- ignore_classes - 模型不会导致损失的类值列表。
- inner_channel - 第一个 U-net 图层的维度。 这是一个可选整数值。 默认值为 64。 仅当骨干模型参数值为 SR3 时,才支持此参数。
- keep_dilation - 指定是否使用 keep_dilation。 当设置为 True 并使用 pointrend 架构时,它可以潜在地提高准确性,但会以内存消耗为代价。 默认值为 False。
- lambda_feat - 要素匹配损失的权重。 默认值为 10。
- lambda_l1 - 要素匹配损失的权重。 默认值为 100。 这不支持 3 波段图像。
- linear_end - 用于计划结束的可选整数。 默认值为 1e-06。 仅当骨干模型参数值为 SR3 时,才支持此参数。
- linear_start - 用于计划开始的可选整数。 默认值为 1e-02。 仅当骨干模型参数值为 SR3 时,才支持此参数。
- lsgan - 指定在训练中是否使用均方误差。 如果为 False,相反它将改用二元交叉熵。 默认值为 True。
- location_loss_factor - 设置边界框损失的权重。 该因素调整模型对边界框位置的焦点。 当将其设置为无时,它会给予位置和分类损失相同的权重。
- min_points - 从每个训练掩膜区域中采样的像素数;该值必须是 64 的倍数。
- mixup - 选择是否使用 mixup。 当设置为 True 时,它会通过随机混合训练集图像来创建新的训练图像。 默认值为 False。
- mlp_ratio - 多层感知器(MLP)的比例。 默认值为 4。
- mlp1 - MLP1 连续要素空间的维度。 默认值为 32,64。
- mlp2 - MLP2 连续要素空间的维度。 默认值为 128,128。
- mlp4 - 解码器 MLP 的尺寸。 默认值为 64,32。
- model - 用于训练模型的骨干模型。 可用骨干取决于指定的模型类型参数值。 此参数仅适用于 MMDetection 和 MMSegmentation 模型类型。 MMDetection 的默认值为 cascade_rcnn。 MMSegmentation 的默认值为 mask2former。
- model_weight - 指定将使用的预训练模型权重。 默认值为 False。 该值也可以是 MMDetection 资料档案库或 MMSegmentation 资料档案库中包含模型权重的配置文件的路径。
- monitor - 指定在检查点和提前停止时要监控的指标。 可用指标取决于模型类型参数值。 默认值为 valid_loss。
- mtl_model - 指定要用于创建模型的架构类型。 对于基于 linknet 或基于 hourglass 的神经架构,对应的选项分别为 linknet 或 hourglass。 默认值为 hourglass。
- n_blocks_global - 全局生成网络中残差块的数量。 默认值为 9。
- n_blocks_local - 局部增强器网络中残差块的数量。 默认值为 3。
- n_downsample_global - 全局生成网络中下采样图层的数量。
- n_dscr - 要使用的鉴别器的数量。 默认值为 2。
- n_dscr_filters - —第一个卷积层中的鉴别器滤波器的数量。 默认值为 64。
- n_gen_filters - 第一个卷积层中的 Gen 滤波器的数量。 默认值为 64。
- n_head - 注意力中心词的数量。 默认值为 4。
- n_layers_dscr - Pix2PixHD 中使用的鉴别器网络的层数。 默认值为 3。
- n_local_enhancers - 要使用的本地增强器的数量。 默认值为 1。
- n_masks - 表示任何图像可以包含的类标签和实例的最大数量。 默认值为 30。
- n_timestep - 扩散时间步数的可选值。 默认值为 1000。 仅当骨干模型参数值为 SR3 时,才支持此参数。
- norm - 指定是否使用实例规范化或批量规范化。 默认值为 instance。
- norm_groups - 用于组归一化的组数。 这是一个可选整数值。 默认值为 32。 仅当骨干模型参数值为 SR3 时,才支持此参数。
- num_heads - 注意力中心词的数量。 默认值为 12。
- orient_bin_size - 方向角的立方图格大小。 默认值为 20。
- orient_theta - 方向掩膜的宽度。 默认值为 8。
- oversample - 指定是否使用过采样。 如果设置为 True,它会在训练期间对数据集的不平衡类别进行过度采样。 MultiLabel 数据集不支持此功能。 默认值为 False。
- patch_size - 用于生成补丁嵌入的补丁大小默认值为 16。
- perceptual_loss - 指定是否在训练中使用感知损失。 默认值为 False。
- pointrend - 指定是否在分割中心词上使用 PointRend 架构。 有关 PointRend 架构的更多信息,请参阅 PointRend PDF。 默认值为 False。
- pooling - 要使用的像素嵌入池策略。 默认值为 mean
- pyramid_sizes - 要应用于不同子区域的卷积层的数量和大小。 默认值为 [1,2,3,6]。 此参数特定于金字塔场景解析网络模型。
- qkv_bias - 指定是否在训练中使用 QK 矢量偏差。 默认值为 False。
- ratios - 用于锚点框的纵横比列表。 在对象检测中,锚点框表示要预测的对象的理想位置、形状和大小。 例如,将此参数设置为 [1.0,1.0], [1.0, 0.5] 表示锚点框是正方形 (1:1) 或水平边大小为垂直边一半 (1:0.5) 的矩形。 RetinaNet 的默认值为 [0.5,1,2]。 单帧检测器的默认值为 [1.0, 1.0]。
- res_blocks - 残差块数。 这是一个可选整数值。 默认值为 3。 仅当骨干模型参数值为 SR3 时,才支持此参数。
- rpn_batch_size_per_image - 在 RPN 训练期间采样的用于计算损失的锚点数量。 默认值为 256。
- rpn_bg_iou_thresh - 锚点和 GT 框之间的最大 IoU,以便在 RPN 训练期间将它们视为负数。 默认值为 0.3。
- rpn_fg_iou_thresh - 锚点和 GT 框之间的最小 IoU,以便在 RPN 训练期间将它们视为正数。 默认值为 0.7。
- rpn_nms_thresh - 用于对 RPN 提议进行后处理的 NMS 阈值。 默认值为 0.7。
- rpn_positive_fraction - RPN 训练期间,小批量中正锚点的比例。 默认值为 0.5。
- rpn_post_nms_top_n_test - 在测试期间应用 NMS 后要保留的提议数量。 默认值为 1000。
- rpn_post_nms_top_n_train - 在训练期间应用 NMS 后要保留的提议数量。 默认值为 2000。
- rpn_pre_nms_top_n_test - 在测试期间应用 NMS 之前要保留的提议数量。 默认值为 1000。
- rpn_pre_nms_top_n_train - 在训练期间应用 NMS 之前要保留的提议数量。 默认值为 2000。
- scales - 每个像元将按比例进行扩大或缩小的比例级数。 默认值为 [1, 0.8, 0.63]。
- schedule - 可选参数,用于设置要使用的计划类型。 选项包括 linear、warmup10、warmup50、const、jsd 和 cosine。 默认值为 linear。 仅当骨干模型参数值为 SR3 时,才支持此参数。
- T - 用于位置编码的周期。 默认值为 1000。
- timesteps_of_interest - 感兴趣的时间步长列表;这将根据指定的时间步长列表过滤多时间序列。 例如,如果数据集有时间步骤 0、1、2 和 3,但训练中仅使用时间步骤 0、1 和 2,则此参数将设置为 [0,1,2]; the rest of the time-steps will be filtered out.
- use_net - 指定在金字塔池化完成后是否使用 U-Net 解码器来恢复数据。 默认值为 True。 此参数特定于金字塔场景解析网络模型。
- vgg_loss - 指定是否使用 VGG 要素匹配损失。 这仅支持 3 波段图像。 默认值为 True。
- zooms - 每个格网像元将按比例进行扩大或缩小的缩放级别数。 将此参数设置为 1 意味着所有格网像元都将保持相同的大小或缩放级别。 缩放级别为 2 表示所有格网像元都将变成两倍大(放大 100%)。 提供缩放级别列表意味着将使用列表中的所有数字来缩放所有格网像元。 默认值为 1。
模型类型 | 参数 | 有效值 |
---|---|---|
变化检测器 (像素分类) | attention_type | PAM(金字塔注意事项模块)或 BAM(基本注意事项模块)。 默认值为 PAM。 |
chip_size | 介于 0 和图像大小之间的整数。 | |
monitor | valid_loss、precision、recall 和 f1。 | |
ConnectNet (像素分类) | chip_size | 介于 0 和图像大小之间的整数。 |
gaussian_thresh | 0.0 至 1.0。 默认值为 0.76。 | |
monitor | valid_loss、accuracy、miou 和 dice。 | |
mtl_model | linknet 或 hourglass。 | |
orient_bin_size | 正数。 默认值为 20。 | |
orient_theta | 正数。 默认值为 8。 | |
CycleGAN (影像转换) | gen_blocks | 正整数。 默认值为 9。 |
lsgan | true 或 false。 默认值为 true。 | |
DeepLabv (像素分类) | chip_size | 介于 0 和图像大小之间的整数。 |
class_balancing | true 或 false。 | |
dice_loss_average | micro 或 macro。 默认值为 micro。 | |
dice_loss_fraction | 0 至 1 之间的浮点值。 默认值为 0。 | |
focal_loss | true 或 false。 | |
ignore_classes | 有效类值。 | |
keep_dilation | true 或 false。 默认值为 false。 | |
mixup | true 或 false。 | |
monitor | valid_loss 和 accuracy。 | |
pointrend | true 或 false。 默认值为 false。 | |
FasterRCNN (对象检测) | box_batch_size_per_image | 正整数。 默认值为 512。 |
box_bg_iou_thresh | 0 至 1 之间的浮点值。 默认值为 0.5。 | |
box_detections_per_img | 正整数。 默认值为 100。 | |
box_fg_iou_thresh | 0 至 1 之间的浮点值。 默认值为 0.5。 | |
box_nms_thresh | 0 至 1 之间的浮点值。 默认值为 0.5。 | |
box_positive_fraction | 0 至 1 之间的浮点值。 默认值为 0.25。 | |
box_score_thresh | 0 至 1 之间的浮点值。 默认值为 0.05。 | |
rpn_batch_size_per_image | 正整数。 默认值为 256。 | |
rpn_bg_iou_thresh | 0 至 1 之间的浮点值。 默认值为 0.3。 | |
rpn_fg_iou_thresh | 0 至 1 之间的浮点值。 默认值为 0.7。 | |
rpn_nms_thresh | 0 至 1 之间的浮点值。 默认值为 0.7。 | |
rpn_positive_fraction | 0 至 1 之间的浮点值。 默认值为 0.5。 | |
rpn_post_nms_top_n_test | 正整数。 默认值为 1000。 | |
rpn_post_nms_top_n_train | 正整数。 默认值为 2000。 | |
rpn_pre_nms_top_n_test | 正整数。 默认值为 1000。 | |
rpn_pre_nms_top_n_train | 正整数。 默认值为 2000。 | |
要素分类器 (对象分类) | backend | pytorch 或 tensorflow。 默认值为 pytorch。 |
mixup | true 或 false。 默认值为 false。 | |
oversample | true 或 false。 默认值为 false。 | |
影像描述生成器 (影像转换) | chip_size | 介于 0 和图像大小之间的整数。 |
decode_params 参数由以下参数组成:
| 默认值为 {'embed_size':100, 'hidden_size':100, 'attention_size':100, 'teacher_forcing':1, 'dropout':0.1, 'pretrained_emb':False}。 | |
monitor | valid_loss、accuracy、corpus_bleu 和 multi_label_fbeta。 | |
MaskRCNN (对象检测) | box_batch_size_per_image | 正整数。 默认值为 512。 |
box_bg_iou_thresh | 0 至 1 之间的浮点值。 默认值为 0.5。 | |
box_detections_per_img | 正整数。 默认值为 100。 | |
box_fg_iou_thresh | 0 至 1 之间的浮点值。 默认值为 0.5。 | |
box_nms_thresh | 0 至 1 之间的浮点值。 默认值为 0.5。 | |
box_positive_fraction | 0 至 1 之间的浮点值。 默认值为 0.25。 | |
box_score_thresh | 0 至 1 之间的浮点值。 默认值为 0.05。 | |
rpn_batch_size_per_image | 正整数。 默认值为 256。 | |
rpn_bg_iou_thresh | 0 至 1 之间的浮点值。 默认值为 0.3。 | |
rpn_fg_iou_thresh | 0 至 1 之间的浮点值。 默认值为 0.7。 | |
rpn_nms_thresh | 0 至 1 之间的浮点值。 默认值为 0.7。 | |
rpn_positive_fraction | 0 至 1 之间的浮点值。 默认值为 0.5。 | |
rpn_post_nms_top_n_test | 正整数。 默认值为 1000。 | |
rpn_post_nms_top_n_train | 正整数。 默认值为 2000。 | |
rpn_pre_nms_top_n_test | 正整数。 默认值为 1000。 | |
rpn_pre_nms_top_n_train | 正整数。 默认值为 2000。 | |
MaXDeepLab (全景分割) | n_masks | 正整数。 默认值为 30。 |
MMDetection (对象检测) | chip_size | 介于 0 和图像大小之间的整数。 |
model | atss、carafe、cascade_rcnn、cascade_rpn、dcn、deeplabv3、detectors、dino、double_heads、dynamic_rcnn、empirical_attention、fcos、foveabox、fsaf、ghm、hrnet、libra_rcnn、nas_fcos、pafpn、pisa、regnet、reppoints、res2net、sabl 和 vfnet。 默认值为 deeplabv3。 | |
model_weight | true 或 false。 | |
MMSegmentation (像素分类) | chip_size | 介于 0 和图像大小之间的整数。 |
model | ann、apcnet、ccnet、cgnet、deeplabv3、deeplabv3plus、dmnet 、dnlnet、emanet、fastscnn、fcn、gcnet、hrnet、mask2former、mobilenet_v2、nonlocal_net、ocrnet、prithvi100m、psanet、pspnet、resnest、sem_fpn、unet 和 upernet。 默认值为 mask2former。 | |
model_weight | true 或 false。 | |
多任务道路提取器 (像素分类) | chip_size | 介于 0 和图像大小之间的整数。 |
gaussian_thresh | 0.0 至 1.0。 默认值为 0.76。 | |
monitor | valid_loss、accuracy、miou 和 dice。 | |
mtl_model | linknet 或 hourglass。 | |
orient_bin_size | 正数。 默认值为 20。 | |
orient_theta | 正数。 默认值为 8。 | |
Pix2Pix (影像转换) | perceptual_loss | true 或 false。 默认值为 false。 |
Pix2PixHD (影像转换) | gen_network | local 或 global。 默认值为 local。 |
feat_loss | true 或 false。 默认值为 true。 | |
lambda_feat | 正整数值。 默认值为 10。 | |
lambda_l1 | 正整数值。 默认值为 100。 | |
lsgan | true 或 false。 默认值为 true。 | |
n_blocks_global | 正整数值。 默认值为 9。 | |
n_blocks_local | 正整数值。 默认值为 3。 | |
n_downsample_global | 正整数值。 默认值为 4。 | |
n_dscr | 正整数值。 默认值为 2。 | |
n_dscr_filters | 正整数值。 默认值为 64。 | |
n_gen_filters | 正整数值。 默认值为 64。 | |
n_layers_dscr | 正整数值。 默认值为 3。 | |
n_local_enhancers | 正整数值。 默认值为 1。 | |
norm | instance 或 batch。 默认值为 instance。 | |
vgg_loss | true 或 false。 默认值为 true。 | |
PSETAE (像素分类) | channels_of_interest | 波段编号列表(正整数)。 |
d_k | 正整数值。 默认值为 32。 | |
dropout | 0 至 1 之间的浮点值。 默认值为 0.2。 | |
min_points | 64 的整数倍数。 | |
mlp1 | 正整数列表。 默认值为 32, 64。 | |
mlp2 | 正整数列表。 默认值为 128, 128。 | |
mlp4 | 正整数列表。 默认值为 64, 32。 | |
n_head | 正整数值。 默认值为 4。 | |
pooling | mean、std、max 或 min。 | |
T | 正整数值。 默认值为 1000。 | |
timesteps_of_interest | 正整数列表。 | |
金字塔场景解析网络 (像素分类) | chip_size | 介于 0 和图像大小之间的整数。 |
class_balancing | true 或 false。 | |
dice_loss_average | micro 或 macro。 默认值为 micro。 | |
dice_loss_fraction | 0 至 1 之间的浮点值。 默认值为 0。 | |
focal_loss | true 或 false。 | |
ignore_classes | 有效类值。 | |
keep_dilation | true 或 false。 默认值为 false。 | |
monitor | valid_loss 或 accuracy。 | |
mixup | true 或 false。 | |
pointrend | true 或 false。 默认值为 false。 | |
pyramid_sizes | [卷积层 1, 卷积层 2, ... , 卷积层 n] | |
use_net | true 或 false。 | |
RetinaNet (对象检测) | chip_size | 介于 0 和图像大小之间的整数。 |
monitor | valid_loss 或 average_precision。 | |
ratios | 比率值 1、比率值 2、比率值 3。 默认值为 0.5,1,2。 | |
scales | [比例值 1, 比例值 2, 比例值 3] 默认值为 [1, 0.8, 0.63]。 | |
SAMLoRA (像素分类) | class_balancing | true 或 false。 |
ignore_classes | 有效类值。 | |
单帧检测器 (对象检测) | backend | pytorch 或 tensorflow。 默认值为 pytorch。 |
bias | 浮点值。 默认值为 -0.4。 | |
chip_size | 介于 0 和图像大小之间的整数。 默认值为 0.3。 | |
drop | 0 至 1 之间的浮点值。 | |
focal_loss | true 或 false。 默认值为 false。 | |
grids | 大于 0 的整数值。 | |
location_loss_factor | 0 至 1 之间的浮点值。 | |
monitor | valid_loss 或 average_precision。 | |
ratios | [水平值, 垂直值] | |
zooms | 缩放值,其中 1.0 为正常缩放。 | |
带 SR3 骨干的超分辨率 (影像转换) | attn_res | 大于 0 的整数。 默认值为 16。 |
channel_mults | 整数乘数设置默认值为 [1, 2, 4, 4, 8, 8]。 | |
downsample_factor | 正整数值。 默认值为 4。 | |
dropout | 浮点值。 默认值为 0。 | |
inner_channel | 大于 0 的整数值。 默认值为 64。 | |
linear_start | 时间整数。 默认值为 1e-02。 | |
linear_end | 时间整数。 默认值为 1e-06。 | |
n_timestep | 大于 0 的整数值。 默认值为 1000。 | |
norm_groups | 大于 0 的整数值。 默认值为 32。 | |
res_blocks | 大于 0 的整数值。 默认值为 3。 | |
schedule | linear、warmup10、warmup50、const、jsd 或 cosine。 默认值为 linear。 | |
带 SR3_UViT 主干的超分辨率 (影像转换) | depth | 正整数点值。 默认值是 17。 |
embed_dim | 正整数点值。 默认值是 768。 | |
mlp_ratio | 正浮点值。 默认值是 4.0。 | |
num_heads | 正整数点值。 默认值为 12。 | |
patch_size | 正整数点值。 默认值为 16。 | |
qkv_bias | true 或 false。 默认值为 false。 | |
U-Net (像素分类) | chip_size | 介于 0 和图像大小之间的整数。 |
class_balancing | true 或 false。 | |
dice_loss_average | micro 或 macro。 默认值为 micro。 | |
dice_loss_fraction | 0 至 1 之间的浮点值。 默认值为 0。 | |
focal_loss | true 或 false。 | |
ignore_classes | 有效类值。 | |
monitor | valid_loss 或 accuracy。 | |
mixup | true 或 false。 |
推断参数
以下参数可用于控制如何训练深度学习模型进行推断。 模型定义参数中的信息将用于填充推断工具中的参数参数。 这些参数将有所不同,具体取决于模型架构。 ArcGIS 预训练模型和自定义深度学习模型可能具有该工具支持的其他参数。
参数 | 推断类型 | 有效值 | |
---|---|---|---|
batch_size | 模型推断每个步骤中处理的影像切片数。 这取决于显卡的内存。 此参数适用于所有模型架构。 | 分类对象 分类像素 检测变化 检测对象 | 大于 0 的整数值;通常为整数幂 2n。 |
direction | 图像将从一个域转换为另一个域。 有关此参数的详细信息,请参阅 CycleGAN 的工作原理。 此参数仅适用于 CycleGAN 架构。 | 分类像素 | 可用选项为 AtoB 和 BtoA。 |
exclude_pad_detections | 如果值为 true,则将过滤影像片内边距区域中的边附近可能被截断的检测结果。 此参数仅适用于 SSD、RetinaNet、YOLOv3、DETReg、MMDetection 和 Faster RCNN。 | 检测对象 | true 或 false。 |
merge_policy | 用于合并增强预测的策略。 此参数仅在使用测试时数据增强时适用。 对于使用深度学习分类像素工具,此参数适用于 MultiTaskRoadExtractor 和 ConnectNet 架构。 如果 IsEdgeDetection 存在于模型的 .emd 文件中,则 BDCNEdgeDetector、HEDEdgeDetector 和 MMSegmentation 架构同样适用。 对于使用深度学习检测对象工具,此参数仅适用于 MaskRCNN。 | 分类像素 检测对象 | 可用选项为 mean、max 和 min。 |
nms_overlap | 两个重叠要素的最大重叠比,其定义为交集区域与并集区域之比。 此参数适用于所有模型架构。 | 检测对象 | 介于 0.0 到 1.0 之间的浮点值。 默认值为 0.1。 |
output_classified_raster | 输出栅格的路径。 此参数仅适用于 MaXDeepLab。 | 检测对象 | 输出分类栅格的文件路径和名称。 |
padding | 影像切片边界处的像素数,将根据这些像素为相邻切片混合预测。 要在减少伪影的同时使输出更加平滑,请增大此值。 内边距的最大值可以是切片大小值的一半。 此参数适用于所有模型架构。 | 分类像素 检测变化 检测对象 | 大于 0 且小于切片大小值一半的整数值。 |
predict_background | 如果为 true,则也会对背景类进行分类。 此参数适用于 UNET、PSPNET、DeepLab 和 MMSegmentation。 | 分类像素 | true 或 false。 |
return_probability_raster | 如果为真,它将输出概率栅格。 概率栅格是一种栅格,其像素指定感兴趣的变量高于或低于指定阈值的概率。 如果模型的 .emd 文件中的 ArcGISLearnVersion 为 1.8.4 或更高版本,则 MultiTaskRoadExtractor 和 ConnectNet 架构适用。 如果 ArcGISLearnVersion 为 1.8.4 或更高版本,并且 IsEdgeDetection 存在于模型的 .emd 文件中,则 BDCNEdgeDetector、HEDEdgeDetector 和 MMSegmentation 架构同样适用。 | 分类像素 | true 或 false。 |
score_threshold | 高于此置信度得分的预测将包含在结果中。 此参数适用于所有模型架构。 | 分类对象 | 0 至 1.0 |
test_time_augmentation | 在预测期间执行测试时数据增强。 如果值为 true,则输入影像的翻转和旋转变体的预测将合并到最终输出中。 此参数适用于大部分模型架构。 | 分类对象 分类像素 | true 或 false。 |
threshold | 置信度得分高于此阈值的预测将包含在结果中。 对于使用深度学习分类像素工具,如果模型的 .emd 文件中的 ArcGISLearnVersion 为 1.8.4 或更高版本,则 MultiTaskRoadExtractor 和 ConnectNet 架构适用。 如果 ArcGISLearnVersion 为 1.8.4 或更高版本,并且 IsEdgeDetection 存在于模型的 .emd 文件中,则 BDCNEdgeDetector、HEDEdgeDetector 和 MMSegmentation 架构同样适用。 对于使用深度学习检测对象工具,此参数适用于所有模型架构。 | 分类像素 检测对象 | 0 至 1.0。 |
thinning | 细化或缩略预测边。 如果 IsEdgeDetection 存在于模型的 .emd 文件中,则 BDCNEdgeDetector、HEDEdgeDetector 和 MMSegmentation 架构适用。 | 分类像素 | true 或 false。 |
tile_size | tile_size - 影像切片的宽度和高度,影像将按照此值分割以进行预测。 对于使用深度学习分类像素工具,此参数仅适用于 CycleGAN 架构。 对于使用深度学习检测对象工具,此参数仅适用于 MaskRCNN。 | 分类像素 检测对象 | 大于 0 且小于图像大小的整数值。 |