Image Analyst ライセンスで利用できます。
ディープ ラーニング モデルをどのようにトレーニングして使用するかを制御する方法は多数あり、引数もその 1 つです。 このトピックでは、1 つ目の表に、ディープ ラーニング モデルのトレーニングについてサポートされているモデル引数が一覧表示されています。 2 つ目の表には、ディープ ラーニング モデルを推論でどのように使用するかを制御する引数が一覧表示されています。
トレーニング引数
[ディープ ラーニング モデルのトレーニング (Train Deep Learning Model)] ツールには、ディープ ラーニング モデルをトレーニングするための引数があります。 これらの引数はモデル アーキテクチャによって異なります。 これらの引数の値を変えてモデルをトレーニングすることができます。 引数は次のとおりです。
- attention_type - モジュール タイプを指定します。 デフォルトは、PAM です。
- attn_res - 残差ブロック内のアテンションの数。 これはオプションの整数値です。デフォルトは 16 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
- backend - このモデルに使用するバックエンド フレームワークを制御します。 Tensorflow を使用するには、プロセッサ タイプを CPU に切り替えます。 デフォルトは、pytorch です。
- bias - シングル ショット検出器 (SSD) ヘッドのバイアス。 デフォルトは -0.4 です。
- box_batch_size_per_image - 分類のトレーニング中にサンプリングされた提案の数。 デフォルトは 512 です。
- box_bg_iou_thresh - 分類ヘッドのトレーニング中に負として見なすことができるようにする、提案と GT (グランドトゥルース) ボックスの間の最大 IoU (Intersection of Union)。 デフォルトは 0.5 です。
- box_detections_per_img - すべてのクラスに対する画像あたりの最大検出数。 デフォルトは 100 です。
- box_fg_iou_thresh - 分類ヘッドのトレーニング中に正として見なすことができるようにする、提案と GT ボックスの間の最小 IoU。 デフォルトは 0.5 です。
- box_nms_thresh - 予測ヘッドの NMS (Non maximum suppression) 閾値。推論中に使用されます。 デフォルトは 0.5 です。
- box_positive_fraction - 分類ヘッドのトレーニング中のミニバッチにおける正の提案の比率。 デフォルトは 0.25 です。
- box_score_thresh - 推論中に提案を返すために満たす必要がある分類スコアの閾値。 デフォルトは 0.05 です。
- channel_mults - U-Net での後続の解像度のためのオプションの深度乗数。 デフォルトは 1、2、4、4、8、8 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
- channels_of_interest - 対象となるスペクトル バンド (チャンネル) のリスト。 これにより、このリストに基づいて複数の時系列のラスターからバンドが除外されます。 たとえば、データセットにバンド 0 ~ 4 が存在するがトレーニングではバンド 0、1、2 のみを使用する場合、リストは [0,1,2] となります。
- chip_size - モデルのトレーニングに使用される画像のサイズ。 画像は、指定のチップ サイズにトリミングされます。
- class_balancing - クラスあたりのピクセルの頻度に逆比例する交差エントロピー誤差のバランスを調整するかどうかを指定します。 デフォルトは False です。
- d_k - キーとクエリ ベクターのディメンション。 デフォルトは 32 です。
- decode_params - 画像キャプショナーの実行方法を制御するディクショナリです。 以下のパラメーターで構成されます。embed_size、hidden_size、attention_size、teacher_forcing、dropout、pretrained_emb。 teacher_forcing は、教師強制の確率です。 Teacher Forcing はリカレント ニューラル ネットワークのトレーニング戦略です。 バック プロパゲーション時に、前の出力ではなく、前の時間ステップから出力されたモデルを入力として使用します。 pretrained_emb は、事前トレーニング済みテキスト埋め込みを使用するかどうかを指定します。 True の場合、高速のテキスト埋め込みを使用します。 False の場合、事前トレーニング済みのテキスト埋め込みを使用しません。
- depth - モデルの深度。 デフォルトは 17 です。
- dice_loss_average - ミクロ平均化またはマクロ平均化のどちらを使用するか選択します。 マクロ平均は、クラスごとに独立した指標を計算してから平均を計算するため、すべてのクラスを同等に処理します。 ミクロ平均は、すべてのクラスの提供を集約して、平均指標を計算します。 マルチクラス分類のセットアップでは、あるクラスのサンプル数が他のクラスよりも多いクラスの不均衡が疑われる場合は、マイクロ平均が適しています。 デフォルトは、micro です。
- dice_loss_fraction - トレーニングをガイドする合計損失で、Dice 損失と比較してデフォルトの損失 (または焦点損失) の加重を調整するために使用されます。 デフォルトは 0 です。 focal_loss が true に設定されている場合、デフォルトの損失の代わりに焦点損失が使用されます。 dice_loss_fraction が 0 に設定されている場合、トレーニングは、トレーニングをガイドする合計損失としてデフォルトの損失 (または焦点損失) を使用します。 dice_loss の割合が 0 より大きい場合、トレーニングは、トレーニングをガイドする合計損失として使用する式を使用します。
=(1 – dice_loss_fraction)*default_loss + dice_loss_fraction*dice_loss
- downsample_factor - 画像をダウンサンプリングするファクター。 デフォルトは 4 です。
- drop - ドロップアウト率。 過剰適合を低減するには、値を増やします。 デフォルトは 0.3 です。
- dropout - ドロップアウト率。 過剰適合を低減するには、値を増やします。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
- embed_dim - 埋め込みのディメンション。 デフォルトは 768 です。
- feat_loss - ディスクリミネーター フィーチャのマッチング損失を使用するかどうかを指定します。 デフォルトは True です。
- focal_loss - 焦点損失を使用するかどうかを指定します。 デフォルトは False です。
- gaussian_thresh - 必要な道幅を設定するガウス閾値。 有効な範囲は 0.0 ~ 1.0 です。 デフォルト値は 0.76 です。
- gen_blocks - ジェネレーターで使用する ResNet ブロックの数。 デフォルトは 9 です。
- gen_network - ジェネレーターで使用するモデルを選択します。 コンピューターの GPU メモリが少ない場合は global を使用します。 デフォルトは、local です。
- grids - 処理中に画像が分割されるグリッドの数です。 たとえば、この引数を 4 に設定すると、画像が 4 x 4、つまり 16 個のグリッド セルに分割されます。 値が指定されない場合は、入力イメージに基づいて最適なグリッド値が計算されます。
- ignore_classes - モデルで損失が発生しないクラス値のリスト。
- inner_channel - 最初の U-net レイヤーのディメンションです。 これはオプションの整数値です。 デフォルトは 64 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
- keep_dilation - keep_dilation を使用するかどうかを指定します。 True に設定され、pointrend アーキテクチャが使用されると、メモリの消費量が増える代わりに、精度が向上する可能性があります。 デフォルトは False です。
- lambda_feat - フィーチャのマッチング損失の加重。 デフォルトは 10 です。
- lambda_l1 - フィーチャのマッチング損失の加重。 デフォルトは 100 です。 3 バンドの画像ではサポートされていません。
- linear_end - 終了をスケジュール設定するためのオプションの整数。 デフォルトは 1e-06 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
- linear_start - 開始をスケジュール設定するためのオプションの整数。 デフォルトは 1e-02 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
- lsgan - トレーニングで平均二乗誤差を使用するかどうかを指定します。 False の場合、バイナリ交差エントロピーを使用します。 デフォルトは True です。
- location_loss_factor - 境界四角形損失の加重を設定します。 このファクターは、境界四角形の位置にモデルの焦点を調整します。 None に設定されている場合、位置と分類損失の両方に等しい加重が付与されます。
- min_points - マスクされたトレーニングの各領域からサンプリングするピクセルの数。この値は 64 の倍数にする必要があります。
- mixup - mixup を使用するかどうかを選択します。 True に設定すると、トレーニング セットの画像をランダムに組み合わせて、新しいトレーニング画像を作成します。 デフォルトは False です。
- mlp_ratio - マルチレイヤー パーセプトロン (MLP) の比率。 デフォルトは 4 です。
- mlp1 - MLP1 の連続するフィーチャ空間のディメンション。 デフォルトは、32,64 です。
- mlp2 - MLP2 の連続するフィーチャ空間のディメンション。 デフォルトは、128,128 です。
- mlp4 - デコーダー MLP の比率。 デフォルトは、64,32 です。
- model - モデルのトレーニングに使用されるバックボーン モデル。 どのバックボーンを使用できるかは、モデル タイプ パラメーターに指定されている値によります。 この引数は MMDetection および MMSegmentation モデル タイプでのみサポートされています。 MMDetection のデフォルトは cascade_rcnn です。 MMSegmentation のデフォルトは mask2former です。
- model_weight - 事前トレーニング済みモデルの加重を使用するかどうかを指定します。 デフォルトは False です。 この値は、モデルのウェイトを含む構成ファイルへの、MMDetection リポジトリまたは MMSegmentation リポジトリからのパスにすることもできます。
- monitor - チェックポイントでのチェックと早期停止の最中にモニタリングするメトリックを指定します。 どの指標を使用できるかは、モデル タイプ パラメーターの値によります。 デフォルトは、valid_loss です。
- mtl_model - モデルの作成に使用されるアーキテクチャ タイプを指定します。 選択肢は LinkNet ベースのニューラル アーキテクチャを示す linknet と Hourglass ベースのニューラル アーキテクチャを示す hourglass です。 デフォルトは、hourglass です。
- n_blocks_global - グローバル ジェネレーター ネットワーク内の残差ブロックの数。 デフォルトは 9 です。
- n_blocks_local - ローカル エンハンサー ネットワーク内の残差ブロックの数。 デフォルトは 3 です。
- n_downsample_global - グローバル ジェネレーター ネットワーク内のダウンサンプリング レイヤーの数。
- n_dscr - 使用するディスクリミネーターの数。 デフォルトは 2 です。
- n_dscr_filters - 最初の畳み込みレイヤー内のディスクリミネーター フィルターの数。 デフォルトは 64 です。
- n_gen_filters - 最初の畳み込みレイヤー内の世代フィルターの数。 デフォルトは 64 です。
- n_head - 注意ヘッドの数。 デフォルトは 4 です。
- n_layers_dscr - Pix2PixHD で使用するディスクリミネーター ネットワークのレイヤーの数。 デフォルトは 3 です。
- n_local_enhancers - 使用するローカル エンハンサーの数。 デフォルトは 1 です。
- n_masks - 画像に含めることができるクラス ラベルとインスタンスの最大数を表します。 デフォルトは 30 です。
- n_timestep - 拡散時間ステップ数のオプションの値。 デフォルトは 1000 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
- norm - インスタンス正規化またはバッチ正規化のどちらを使用するかを指定します。 デフォルトは、instance です。
- norm_groups - グループ正規化のグループ数。 これはオプションの整数値です。 デフォルトは 32 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
- num_heads - 注意ヘッドの数。 デフォルトは 12 です。
- orient_bin_size - 方位角のビン サイズ。 デフォルトは 20 です。
- orient_theta - 方位マスクの幅。 デフォルトは 8 です。
- oversample - オーバーサンプリングを使用するかどうかを指定します。 True に設定すると、トレーニング中にバランス調整されていないデータセットのクラスをオーバーサンプリングします。 複数ラベルのデータセットではサポートされていません。 デフォルトは False です。
- patch_size - パッチ埋め込みを生成するためのパッチ サイズ。デフォルトは 16 です。
- perceptual_loss - トレーニングでパーセプトロン損失を使用するかどうかを指定します。 デフォルトは False です。
- pointrend - セグメンテーション ヘッドの上部に PointRend アーキテクチャを使用するかどうかを指定します。 PointRend アーキテクチャの詳細については、PointRend の PDF をご参照ください。 デフォルトは False です。
- pooling - 使用するピクセル埋め込みプール戦略。 デフォルトは mean です。
- pyramid_sizes - それぞれの小区域に適用される畳み込みレイヤーの数とサイズです。 デフォルト値は [1,2,3,6] です。 この引数は、ピラミッド型解析ネットワーク モデルに固有のものです。
- qkv_bias - トレーニングで QK ベクトル バイアスを使用するかどうかを指定します。 デフォルトは False です。
- ratios - アンカー ボックスで使用する縦横比のリストです。 オブジェクト検出を行う場合、アンカー ボックスは予測対象のオブジェクトに最適な位置、形状、サイズを表します。 たとえば、この引数を [1.0, 1.0]、[1.0, 0.5] に設定すると、アンカー ボックスが正方形 (1:1) になるか、水平側が鉛直側の半分の長方形 (1:0.5) になります。 RetinaNet のデフォルトは [0.5,1,2] です。 シングル ショット検出器のデフォルトは [1.0, 1.0] です。
- res_blocks - 残差ブロックの数。 これはオプションの整数値です。 デフォルトは 3 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
- rpn_batch_size_per_image - 損失の計算で RPN のトレーニング中にサンプリングされたアンカーの数。 デフォルトは 256 です。
- rpn_bg_iou_thresh - RPN のトレーニング中に負として見なすことができるようにする、アンカーと GT ボックスの間の最大 IoU。 デフォルトは 0.3 です。
- rpn_fg_iou_thresh - RPN のトレーニング中に正として見なすことができるようにする、アンカーと GT ボックスの間の最小 IoU。 デフォルトは 0.7 です。
- rpn_nms_thresh - RPN 提案の後処理に使用される NMS 閾値。 デフォルトは 0.7 です。
- rpn_positive_fraction - RPN のトレーニング中のミニバッチにおける正のアンカーの比率。 デフォルトは 0.5 です。
- rpn_post_nms_top_n_test - テスト中に NMS の適用後に保持する提案の数。 デフォルトは 1000 です。
- rpn_post_nms_top_n_train - トレーニング中に NMS の適用後に保持する提案の数。 デフォルトは 2000 です。
- rpn_pre_nms_top_n_test - テスト中に NMS の適用前に保持する提案の数。 デフォルトは 1000 です。
- rpn_pre_nms_top_n_train - トレーニング中に NMS の適用前に保持する提案の数。 デフォルトは 2000 です。
- scales - 各セルが拡大/縮小される縮尺レベルの数です。 デフォルト値は [1, 0.8, 0.63] です。
- schedule - 使用するスケジュールのタイプを設定するオプションの引数。 オプションは、リニア、warmup10、warmup50、定数、jsd、余弦 です。 デフォルトはリニアです。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
- T - 位置エンコーディングに使用する期間。 デフォルトは 1000 です。
- timesteps_of_interest - 対象の時間ステップのリスト。これにより、指定された時間ステップのリストに基づいて複数の時系列をフィルターします。 たとえば、データセットに時間ステップ 0、1、2、3 があるが時間ステップ 0、1、2 がトレーニングで使用されている場合、このパラメーターは [0,1,2]; the rest of the time-steps will be filtered out. に設定されます。
- use_net - ピラミッド プーリングが完了した時点で U-Net デコーダーを使用してデータを復元するかどうかを指定します。 デフォルトは True です。 この引数は、ピラミッド型解析ネットワーク モデルに固有のものです。
- vgg_loss - VGG フィーチャのマッチング損失を使用するかどうかを指定します。 3 バンドの画像でのみサポートされています。 デフォルトは True です。
- zooms - 各グリッド セルが拡大/縮小されるズーム レベルの数です。 この引数を 1 に設定すると、すべてのグリッド セルが同じサイズまたはズーム レベルで維持されます。 ズーム レベルが 2 の場合は、すべてのグリッド セルが 2 倍の大きさになります (100 パーセントでズームされる)。 ズーム レベルのリストを指定すると、そのリスト内のすべての数値を使用して、すべてのグリッド セルが拡大/縮小されます。 デフォルトは 1 です。
モデル タイプ | 引数 | 有効な値 |
---|---|---|
Change detector (ピクセル分類) | attention_type | PAM (Pyramid Attention Module) または BAM (Basic Attention Module)。 デフォルトは、PAM です。 |
chip_size | 0 から画像サイズの間の整数。 | |
monitor | valid_loss、precision、recall、および f1。 | |
ConnectNet (ピクセル分類) | chip_size | 0 から画像サイズの間の整数。 |
gaussian_thresh | 0.0 ~ 1.0。 デフォルト値は 0.76 です。 | |
monitor | valid_loss、accuracy、miou、および dice。 | |
mtl_model | linknet または hourglass。 | |
orient_bin_size | 正の数値。 デフォルトは 20 です。 | |
orient_theta | 正の数値。 デフォルトは 8 です。 | |
CycleGAN (画像変換) | gen_blocks | 正の整数。 デフォルトは 9 です。 |
lsgan | true または false。 デフォルトは、true です。 | |
DeepLabv (ピクセル分類) | chip_size | 0 から画像サイズの間の整数。 |
class_balancing | true または false。 | |
dice_loss_average | micro または macro。 デフォルトは、micro です。 | |
dice_loss_fraction | 0 ~ 1 の浮動小数点値。 デフォルトは 0 です。 | |
focal_loss | true または false。 | |
ignore_classes | 有効なクラス値。 | |
keep_dilation | true または false。 デフォルトは、false です。 | |
mixup | true または false。 | |
monitor | valid_loss および accuracy。 | |
pointrend | true または false。 デフォルトは、false です。 | |
FasterRCNN (オブジェクトの検出) | box_batch_size_per_image | 正の整数。 デフォルトは 512 です。 |
box_bg_iou_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。 | |
box_detections_per_img | 正の整数。 デフォルトは 100 です。 | |
box_fg_iou_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。 | |
box_nms_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。 | |
box_positive_fraction | 0 ~ 1 の浮動小数点値。 デフォルトは 0.25 です。 | |
box_score_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.05 です。 | |
rpn_batch_size_per_image | 正の整数。 デフォルトは 256 です。 | |
rpn_bg_iou_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.3 です。 | |
rpn_fg_iou_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.7 です。 | |
rpn_nms_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.7 です。 | |
rpn_positive_fraction | 0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。 | |
rpn_post_nms_top_n_test | 正の整数。 デフォルトは 1000 です。 | |
rpn_post_nms_top_n_train | 正の整数。 デフォルトは 2000 です。 | |
rpn_pre_nms_top_n_test | 正の整数。 デフォルトは 1000 です。 | |
rpn_pre_nms_top_n_train | 正の整数。 デフォルトは 2000 です。 | |
フィーチャ分類器 (オブジェクトの分類) | backend | pytorch または tensorflow。 デフォルトは、pytorch です。 |
mixup | true または false。 デフォルトは、false です。 | |
oversample | true または false。 デフォルトは、false です。 | |
Image captioner (画像変換) | chip_size | 0 から画像サイズの間の整数。 |
decode_params 引数は、以下のパラメーターで構成されます。
| デフォルトは、{'embed_size':100, 'hidden_size':100, 'attention_size':100, 'teacher_forcing':1, 'dropout':0.1, 'pretrained_emb':False} です。 | |
monitor | valid_loss、accuracy、corpus_bleu、および multi_label_fbeta。 | |
MaskRCNN (オブジェクトの検出) | box_batch_size_per_image | 正の整数。 デフォルトは 512 です。 |
box_bg_iou_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。 | |
box_detections_per_img | 正の整数。 デフォルトは 100 です。 | |
box_fg_iou_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。 | |
box_nms_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。 | |
box_positive_fraction | 0 ~ 1 の浮動小数点値。 デフォルトは 0.25 です。 | |
box_score_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.05 です。 | |
rpn_batch_size_per_image | 正の整数。 デフォルトは 256 です。 | |
rpn_bg_iou_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.3 です。 | |
rpn_fg_iou_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.7 です。 | |
rpn_nms_thresh | 0 ~ 1 の浮動小数点値。 デフォルトは 0.7 です。 | |
rpn_positive_fraction | 0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。 | |
rpn_post_nms_top_n_test | 正の整数。 デフォルトは 1000 です。 | |
rpn_post_nms_top_n_train | 正の整数。 デフォルトは 2000 です。 | |
rpn_pre_nms_top_n_test | 正の整数。 デフォルトは 1000 です。 | |
rpn_pre_nms_top_n_train | 正の整数。 デフォルトは 2000 です。 | |
MaXDeepLab (パノプティック セグメンテーション) | n_masks | 正の整数。 デフォルトは 30 です。 |
MMDetection (オブジェクトの検出) | chip_size | 0 から画像サイズの間の整数。 |
model | atss、carafe、cascade_rcnn、cascade_rpn、dcn、deeplabv3、detectors、dino、double_heads、dynamic_rcnn、empirical_attention、fcos、foveabox、fsaf、ghm、hrnet、libra_rcnn、nas_fcos、pafpn、pisa、regnet、reppoints、res2net、sabl、vfnet。 デフォルトは、deeplabv3 です。 | |
model_weight | true または false。 | |
MMSegmentation (ピクセル分類) | chip_size | 0 から画像サイズの間の整数。 |
model | ann、apcnet、ccnet、cgnet、deeplabv3、deeplabv3plus、dmnet 、dnlnet、emanet、fastscnn、fcn、gcnet、hrnet、mask2former、mobilenet_v2、nonlocal_net、ocrnet、prithvi100m、psanet、pspnet、resnest、sem_fpn、unet、upernet。 デフォルトは、mask2former です。 | |
model_weight | true または false。 | |
Multi Task Road Extractor (ピクセル分類) | chip_size | 0 から画像サイズの間の整数。 |
gaussian_thresh | 0.0 ~ 1.0。 デフォルト値は 0.76 です。 | |
monitor | valid_loss、accuracy、miou、および dice。 | |
mtl_model | linknet または hourglass。 | |
orient_bin_size | 正の数値。 デフォルトは 20 です。 | |
orient_theta | 正の数値。 デフォルトは 8 です。 | |
Pix2Pix (画像変換) | perceptual_loss | true または false。 デフォルトは、false です。 |
Pix2PixHD (画像変換) | gen_network | local または global。 デフォルトは、local です。 |
feat_loss | true または false。 デフォルトは、true です。 | |
lambda_feat | 正の整数値。 デフォルトは 10 です。 | |
lambda_l1 | 正の整数値。 デフォルトは 100 です。 | |
lsgan | true または false。 デフォルトは、true です。 | |
n_blocks_global | 正の整数値。 デフォルトは 9 です。 | |
n_blocks_local | 正の整数値。 デフォルトは 3 です。 | |
n_downsample_global | 正の整数値。 デフォルトは 4 です。 | |
n_dscr | 正の整数値。 デフォルトは 2 です。 | |
n_dscr_filters | 正の整数値。 デフォルトは 64 です。 | |
n_gen_filters | 正の整数値。 デフォルトは 64 です。 | |
n_layers_dscr | 正の整数値。 デフォルトは 3 です。 | |
n_local_enhancers | 正の整数値。 デフォルトは 1 です。 | |
norm | instance または batch。 デフォルトは、instance です。 | |
vgg_loss | true または false。 デフォルトは、true です。 | |
PSETAE (ピクセル分類) | channels_of_interest | バンド番号のリスト (正の整数)。 |
d_k | 正の整数値。 デフォルトは 32 です。 | |
dropout | 0 ~ 1 の浮動小数点値。 デフォルトは 0.2 です。 | |
min_points | 64 の整数倍。 | |
mlp1 | 正の整数のリスト。 デフォルトは、32, 64 です。 | |
mlp2 | 正の整数のリスト。 デフォルトは、128, 128 です。 | |
mlp4 | 正の整数のリスト。 デフォルトは、64, 32 です。 | |
n_head | 正の整数値。 デフォルトは 4 です。 | |
pooling | mean、std、max、min。 | |
T | 正の整数値。 デフォルトは 1000 です。 | |
timesteps_of_interest | 正の整数のリスト。 | |
ピラミッド シーン解析ネットワーク (ピクセル分類) | chip_size | 0 から画像サイズの間の整数。 |
class_balancing | true または false。 | |
dice_loss_average | micro または macro。 デフォルトは、micro です。 | |
dice_loss_fraction | 0 ~ 1 の浮動小数点値。 デフォルトは 0 です。 | |
focal_loss | true または false。 | |
ignore_classes | 有効なクラス値。 | |
keep_dilation | true または false。 デフォルトは、false です。 | |
monitor | valid_loss または accuracy。 | |
mixup | true または false。 | |
pointrend | true または false。 デフォルトは、false です。 | |
pyramid_sizes | [畳み込みレイヤー 1, 畳み込みレイヤー 2, ... , 畳み込みレイヤー n] | |
use_net | true または false。 | |
RetinaNet (オブジェクトの検出) | chip_size | 0 から画像サイズの間の整数。 |
monitor | valid_loss または average_precision。 | |
ratios | 比率値 1, 比率値 2, 比率値 3 デフォルトは、0.5,1,2 です。 | |
scales | [縮尺値 1, 縮尺値 2, 縮尺値 3] デフォルトは、[1, 0.8, 0.63] です。 | |
SAMLoRA (ピクセル分類) | class_balancing | true または false。 |
ignore_classes | 有効なクラス値。 | |
シングル ショット検出器 (オブジェクトの検出) | backend | pytorch または tensorflow。 デフォルトは、pytorch です。 |
bias | 浮動小数点値。 デフォルトは -0.4 です。 | |
chip_size | 0 から画像サイズの間の整数。 デフォルトは 0.3 です。 | |
drop | 0 ~ 1 の浮動小数点値。 | |
focal_loss | true または false。 デフォルトは、false です。 | |
grids | 0 より大きい整数値。 | |
location_loss_factor | 0 ~ 1 の浮動小数点値。 | |
monitor | valid_loss または average_precision。 | |
ratios | [水平値, 垂直値] | |
zooms | ズーム値 (1.0 が標準縮尺)。 | |
Super Resolution with SR3 backbone (画像変換) | attn_res | 0 より大きい整数。 デフォルトは 16 です。 |
channel_mults | 整数の乗数セット。デフォルトは [1、2、4、4、8、8] です。 | |
downsample_factor | 正の整数値。 デフォルトは 4 です。 | |
dropout | 浮動小数点値。 デフォルトは 0 です。 | |
inner_channel | 0 より大きい整数値。 デフォルトは 64 です。 | |
linear_start | 時間を表す整数。 デフォルトは 1e-02 です。 | |
linear_end | 時間を表す整数。 デフォルトは 1e-06 です。 | |
n_timestep | 0 より大きい整数値。 デフォルトは 1000 です。 | |
norm_groups | 0 より大きい整数値。 デフォルトは 32 です。 | |
res_blocks | 0 より大きい整数値。 デフォルトは 3 です。 | |
schedule | linear、warmup10、warmup50、const、jsd、または cosine。 デフォルトは、linear です。 | |
Super Resolution with SR3_UViT backbone (画像変換) | depth | 正の整数点値。 デフォルトは 17 です。 |
embed_dim | 正の整数点値。 デフォルトは 768 です。 | |
mlp_ratio | 正の浮動小数点値。 デフォルトは 4.0 です。 | |
num_heads | 正の整数点値。 デフォルトは 12 です。 | |
patch_size | 正の整数点値。 デフォルトは 16 です。 | |
qkv_bias | true または false。 デフォルトは、false です。 | |
U-Net (ピクセル分類) | chip_size | 0 から画像サイズの間の整数。 |
class_balancing | true または false。 | |
dice_loss_average | micro または macro。 デフォルトは、micro です。 | |
dice_loss_fraction | 0 ~ 1 の浮動小数点値。 デフォルトは 0 です。 | |
focal_loss | true または false。 | |
ignore_classes | 有効なクラス値。 | |
monitor | valid_loss または accuracy。 | |
mixup | true または false。 |
推論引数
次の引数を使用して、ディープ ラーニング モデルを推論用にどのようにトレーニングするかを制御できます。 [モデル定義] パラメーターからの情報が、推論ツールの [引数] パラメーターの設定に使用されます。 これらの引数はモデル アーキテクチャによって異なります。 ArcGIS 事前トレーニング済みモデルとカスタム ディープ ラーニング モデルでは、このツールでサポートされている追加の引数を利用できることがあります。
引数 | 推測タイプ | 有効な値 | |
---|---|---|---|
batch_size | モデル推論の各ステップで処理された画像タイルの数。 これは、お使いのグラフィックス カードのメモリに応じて異なります。 この引数はすべてのモデル アーキテクチャで使用できます。 | オブジェクトの分類 ピクセルの分類 変化検出 オブジェクトの検出 | 0 より大きい整数値。通常は 2 の累乗 (2n) の整数です。 |
direction | 画像が 2 つのドメイン間で変換されます。 この引数の詳細については、「CycleGAN の機能」をご参照ください。 この引数は CycleGAN アーキテクチャでのみ使用できます。 | ピクセルの分類 | 利用可能なオプションは AtoB と BtoA です。 |
exclude_pad_detections | \true の場合、画像チップのパディングされた領域にあるエッジ付近で切り捨てられる可能性のある検出をフィルターします。 この引数は SSD、RetinaNet、YOLOv3、DETReg、MMDetection、Faster RCNN のみで使用できます。 | オブジェクトの検出 | true または false。 |
merge_policy | 拡張された予測のマージに関するポリシー。 これは、テスト時間の延長が使用される場合に限り適用できます。 [ディープ ラーニングを使用したピクセルの分類 (Classify Pixels Using Deep Learning)] ツールの場合、この引数は MultiTaskRoadExtractor および ConnectNet アーキテクチャで使用できます。 IsEdgeDetection がモデルの .emd ファイルに存在する場合、BDCNEdgeDetector、HEDEdgeDetector、MMSegmentation アーキテクチャでも使用できます。 [ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールの場合、この引数は MaskRCNN でのみ使用できます。 | ピクセルの分類 オブジェクトの検出 | 使用可能なオプションは mean、max、および min です。 |
nms_overlap | 2 つの重複したフィーチャの最大オーバーラップ率。結合領域に対する交差領域の比率として定義されます。 この引数はすべてのモデル アーキテクチャで使用できます。 | オブジェクトの検出 | 0.0 ~ 1.0 の浮動小数点値。 デフォルトは 0.1 です。 |
output_classified_raster | 出力ラスターへのパス。 この引数は MaXDeepLab でのみ使用できます。 | オブジェクトの検出 | 出力分類ラスターのファイル パスと名前。 |
padding | 隣接するタイルの予測がブレンドされる画像タイルの境界のピクセル数。 出力を滑らかにすると同時にアーティファクトを減らすには、この値を大きくします。 パディングの最大値には、タイル サイズの値の半分を設定できます。 この引数はすべてのモデル アーキテクチャで使用できます。 | ピクセルの分類 変化検出 オブジェクトの検出 | 0 より大きくタイル サイズの値の半分より小さい整数値。 |
predict_background | true の場合、背景クラスも分類されます。 この引数は UNET、PSPNET、DeepLab、MMSegmentation で使用できます。 | ピクセルの分類 | true または false。 |
return_probability_raster | true の場合、確率ラスターを出力します。 確率ラスターは、関心のある変数が指定された閾値を上回る、または下回る可能性をピクセルで指定するラスターです。 モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上の場合、MultiTaskRoadExtractor および ConnectNet アーキテクチャを利用できます。 モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上であり、IsEdgeDetection が存在する場合は、BDCNEdgeDetector、HEDEdgeDetector、および MMSegmentation アーキテクチャも利用できます。 | ピクセルの分類 | true または false。 |
score_threshold | この信頼度スコアを上回る予測が、結果に追加されます。 この引数はすべてのモデル アーキテクチャで使用できます。 | オブジェクトの分類 | 0 ~ 1.0 |
test_time_augmentation | 予測中にテスト時間の延長を実行します。 true の場合、入力画像の反転および回転バリアントの予測は、最終出力にマージされます。 この引数はほとんどのモデル アーキテクチャで使用できます。 | オブジェクトの分類 ピクセルの分類 | true または false。 |
threshold | この閾値よりも信頼度スコアが高い予測が、結果に追加されます。 [ディープ ラーニングを使用したピクセルの分類 (Classify Pixels Using Deep Learning)] ツールの場合、モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上の場合、MultiTaskRoadExtractor および ConnectNet アーキテクチャを利用できます。 モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上であり、IsEdgeDetection が存在する場合は、BDCNEdgeDetector、HEDEdgeDetector、および MMSegmentation アーキテクチャも利用できます。 [ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールの場合、この引数はすべてのモデル アーキテクチャで使用できます。 | ピクセルの分類 オブジェクトの検出 | 0 ~ 1.0。 |
thinning | 予測されたエッジを細線化またはスケルトン化します。 IsEdgeDetection がモデルの .emd ファイルに存在する場合、BDCNEdgeDetector、HEDEdgeDetector、MMSegmentation アーキテクチャで使用できます。 | ピクセルの分類 | true または false。 |
tile_size | tile_size - 予測のために画像が分割される画像タイルの幅と高さ。 [ディープ ラーニングを使用したピクセルの分類 (Classify Pixels Using Deep Learning)] ツールの場合、この引数は CycleGAN アーキテクチャでのみ使用できます。 [ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールの場合、この引数は MaskRCNN でのみ使用できます。 | ピクセルの分類 オブジェクトの検出 | 0 より大きく画像のサイズより小さい整数値。 |