ディープ ラーニング引数

Image Analyst ライセンスで利用できます。

ディープ ラーニング モデルをどのようにトレーニングして使用するかを制御する方法は多数あり、引数もその 1 つです。 このトピックでは、1 つ目の表に、ディープ ラーニング モデルのトレーニングについてサポートされているモデル引数が一覧表示されています。 2 つ目の表には、ディープ ラーニング モデルを推論でどのように使用するかを制御する引数が一覧表示されています。

トレーニング引数

[ディープ ラーニング モデルのトレーニング (Train Deep Learning Model)] ツールには、ディープ ラーニング モデルをトレーニングするための引数があります。 これらの引数はモデル アーキテクチャによって異なります。 これらの引数の値を変えてモデルをトレーニングすることができます。 引数は次のとおりです。

  • attention_type - モジュール タイプを指定します。 デフォルトは、PAM です。
  • attn_res - 残差ブロック内のアテンションの数。 これはオプションの整数値です。デフォルトは 16 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
  • backend - このモデルに使用するバックエンド フレームワークを制御します。 Tensorflow を使用するには、プロセッサ タイプを CPU に切り替えます。 デフォルトは、pytorch です。
  • bias - シングル ショット検出器 (SSD) ヘッドのバイアス。 デフォルトは -0.4 です。
  • box_batch_size_per_image - 分類のトレーニング中にサンプリングされた提案の数。 デフォルトは 512 です。
  • box_bg_iou_thresh - 分類ヘッドのトレーニング中に負として見なすことができるようにする、提案と GT (グランドトゥルース) ボックスの間の最大 IoU (Intersection of Union)。 デフォルトは 0.5 です。
  • box_detections_per_img - すべてのクラスに対する画像あたりの最大検出数。 デフォルトは 100 です。
  • box_fg_iou_thresh - 分類ヘッドのトレーニング中に正として見なすことができるようにする、提案と GT ボックスの間の最小 IoU。 デフォルトは 0.5 です。
  • box_nms_thresh - 予測ヘッドの NMS (Non maximum suppression) 閾値。推論中に使用されます。 デフォルトは 0.5 です。
  • box_positive_fraction - 分類ヘッドのトレーニング中のミニバッチにおける正の提案の比率。 デフォルトは 0.25 です。
  • box_score_thresh - 推論中に提案を返すために満たす必要がある分類スコアの閾値。 デフォルトは 0.05 です。
  • channel_mults - U-Net での後続の解像度のためのオプションの深度乗数。 デフォルトは 1、2、4、4、8、8 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
  • channels_of_interest - 対象となるスペクトル バンド (チャンネル) のリスト。 これにより、このリストに基づいて複数の時系列のラスターからバンドが除外されます。 たとえば、データセットにバンド 0 ~ 4 が存在するがトレーニングではバンド 0、1、2 のみを使用する場合、リストは [0,1,2] となります。
  • chip_size - モデルのトレーニングに使用される画像のサイズ。 画像は、指定のチップ サイズにトリミングされます。
  • class_balancing - クラスあたりのピクセルの頻度に逆比例する交差エントロピー誤差のバランスを調整するかどうかを指定します。 デフォルトは False です。
  • d_k - キーとクエリ ベクターのディメンション。 デフォルトは 32 です。
  • decode_params - 画像キャプショナーの実行方法を制御するディクショナリです。 以下のパラメーターで構成されます。embed_sizehidden_sizeattention_sizeteacher_forcingdropoutpretrained_embteacher_forcing は、教師強制の確率です。 Teacher Forcing はリカレント ニューラル ネットワークのトレーニング戦略です。 バック プロパゲーション時に、前の出力ではなく、前の時間ステップから出力されたモデルを入力として使用します。 pretrained_emb は、事前トレーニング済みテキスト埋め込みを使用するかどうかを指定します。 True の場合、高速のテキスト埋め込みを使用します。 False の場合、事前トレーニング済みのテキスト埋め込みを使用しません。
  • depth - モデルの深度。 デフォルトは 17 です。
  • dice_loss_average - ミクロ平均化またはマクロ平均化のどちらを使用するか選択します。 マクロ平均は、クラスごとに独立した指標を計算してから平均を計算するため、すべてのクラスを同等に処理します。 ミクロ平均は、すべてのクラスの提供を集約して、平均指標を計算します。 マルチクラス分類のセットアップでは、あるクラスのサンプル数が他のクラスよりも多いクラスの不均衡が疑われる場合は、マイクロ平均が適しています。 デフォルトは、micro です。
  • dice_loss_fraction - トレーニングをガイドする合計損失で、Dice 損失と比較してデフォルトの損失 (または焦点損失) の加重を調整するために使用されます。 デフォルトは 0 です。 focal_losstrue に設定されている場合、デフォルトの損失の代わりに焦点損失が使用されます。 dice_loss_fraction が 0 に設定されている場合、トレーニングは、トレーニングをガイドする合計損失としてデフォルトの損失 (または焦点損失) を使用します。 dice_loss の割合が 0 より大きい場合、トレーニングは、トレーニングをガイドする合計損失として使用する式を使用します。
    =(1 – dice_loss_fraction)*default_loss + dice_loss_fraction*dice_loss
  • downsample_factor - 画像をダウンサンプリングするファクター。 デフォルトは 4 です。
  • drop - ドロップアウト率。 過剰適合を低減するには、値を増やします。 デフォルトは 0.3 です。
  • dropout - ドロップアウト率。 過剰適合を低減するには、値を増やします。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
  • embed_dim - 埋め込みのディメンション。 デフォルトは 768 です。
  • feat_loss - ディスクリミネーター フィーチャのマッチング損失を使用するかどうかを指定します。 デフォルトは True です。
  • focal_loss - 焦点損失を使用するかどうかを指定します。 デフォルトは False です。
  • gaussian_thresh - 必要な道幅を設定するガウス閾値。 有効な範囲は 0.0 ~ 1.0 です。 デフォルト値は 0.76 です。
  • gen_blocks - ジェネレーターで使用する ResNet ブロックの数。 デフォルトは 9 です。
  • gen_network - ジェネレーターで使用するモデルを選択します。 コンピューターの GPU メモリが少ない場合は global を使用します。 デフォルトは、local です。
  • grids - 処理中に画像が分割されるグリッドの数です。 たとえば、この引数を 4 に設定すると、画像が 4 x 4、つまり 16 個のグリッド セルに分割されます。 値が指定されない場合は、入力イメージに基づいて最適なグリッド値が計算されます。
  • ignore_classes - モデルで損失が発生しないクラス値のリスト。
  • inner_channel - 最初の U-net レイヤーのディメンションです。 これはオプションの整数値です。 デフォルトは 64 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
  • keep_dilation - keep_dilation を使用するかどうかを指定します。 True に設定され、pointrend アーキテクチャが使用されると、メモリの消費量が増える代わりに、精度が向上する可能性があります。 デフォルトは False です。
  • lambda_feat - フィーチャのマッチング損失の加重。 デフォルトは 10 です。
  • lambda_l1 - フィーチャのマッチング損失の加重。 デフォルトは 100 です。 3 バンドの画像ではサポートされていません。
  • linear_end - 終了をスケジュール設定するためのオプションの整数。 デフォルトは 1e-06 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
  • linear_start - 開始をスケジュール設定するためのオプションの整数。 デフォルトは 1e-02 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
  • lsgan - トレーニングで平均二乗誤差を使用するかどうかを指定します。 False の場合、バイナリ交差エントロピーを使用します。 デフォルトは True です。
  • location_loss_factor - 境界四角形損失の加重を設定します。 このファクターは、境界四角形の位置にモデルの焦点を調整します。 None に設定されている場合、位置と分類損失の両方に等しい加重が付与されます。
  • min_points - マスクされたトレーニングの各領域からサンプリングするピクセルの数。この値は 64 の倍数にする必要があります。
  • mixup - mixup を使用するかどうかを選択します。 True に設定すると、トレーニング セットの画像をランダムに組み合わせて、新しいトレーニング画像を作成します。 デフォルトは False です。
  • mlp_ratio - マルチレイヤー パーセプトロン (MLP) の比率。 デフォルトは 4 です。
  • mlp1 - MLP1 の連続するフィーチャ空間のディメンション。 デフォルトは、32,64 です。
  • mlp2 - MLP2 の連続するフィーチャ空間のディメンション。 デフォルトは、128,128 です。
  • mlp4 - デコーダー MLP の比率。 デフォルトは、64,32 です。
  • model - モデルのトレーニングに使用されるバックボーン モデル。 どのバックボーンを使用できるかは、モデル タイプ パラメーターに指定されている値によります。 この引数は MMDetection および MMSegmentation モデル タイプでのみサポートされています。 MMDetection のデフォルトは cascade_rcnn です。 MMSegmentation のデフォルトは mask2former です。
  • model_weight - 事前トレーニング済みモデルの加重を使用するかどうかを指定します。 デフォルトは False です。 この値は、モデルのウェイトを含む構成ファイルへの、MMDetection リポジトリまたは MMSegmentation リポジトリからのパスにすることもできます。
  • monitor - チェックポイントでのチェックと早期停止の最中にモニタリングするメトリックを指定します。 どの指標を使用できるかは、モデル タイプ パラメーターの値によります。 デフォルトは、valid_loss です。
  • mtl_model - モデルの作成に使用されるアーキテクチャ タイプを指定します。 選択肢は LinkNet ベースのニューラル アーキテクチャを示す linknet と Hourglass ベースのニューラル アーキテクチャを示す hourglass です。 デフォルトは、hourglass です。
  • n_blocks_global - グローバル ジェネレーター ネットワーク内の残差ブロックの数。 デフォルトは 9 です。
  • n_blocks_local - ローカル エンハンサー ネットワーク内の残差ブロックの数。 デフォルトは 3 です。
  • n_downsample_global - グローバル ジェネレーター ネットワーク内のダウンサンプリング レイヤーの数。
  • n_dscr - 使用するディスクリミネーターの数。 デフォルトは 2 です。
  • n_dscr_filters - 最初の畳み込みレイヤー内のディスクリミネーター フィルターの数。 デフォルトは 64 です。
  • n_gen_filters - 最初の畳み込みレイヤー内の世代フィルターの数。 デフォルトは 64 です。
  • n_head - 注意ヘッドの数。 デフォルトは 4 です。
  • n_layers_dscr - Pix2PixHD で使用するディスクリミネーター ネットワークのレイヤーの数。 デフォルトは 3 です。
  • n_local_enhancers - 使用するローカル エンハンサーの数。 デフォルトは 1 です。
  • n_masks - 画像に含めることができるクラス ラベルとインスタンスの最大数を表します。 デフォルトは 30 です。
  • n_timestep - 拡散時間ステップ数のオプションの値。 デフォルトは 1000 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
  • norm - インスタンス正規化またはバッチ正規化のどちらを使用するかを指定します。 デフォルトは、instance です。
  • norm_groups - グループ正規化のグループ数。 これはオプションの整数値です。 デフォルトは 32 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
  • num_heads - 注意ヘッドの数。 デフォルトは 12 です。
  • orient_bin_size - 方位角のビン サイズ。 デフォルトは 20 です。
  • orient_theta - 方位マスクの幅。 デフォルトは 8 です。
  • oversample - オーバーサンプリングを使用するかどうかを指定します。 True に設定すると、トレーニング中にバランス調整されていないデータセットのクラスをオーバーサンプリングします。 複数ラベルのデータセットではサポートされていません。 デフォルトは False です。
  • patch_size - パッチ埋め込みを生成するためのパッチ サイズ。デフォルトは 16 です。
  • perceptual_loss - トレーニングでパーセプトロン損失を使用するかどうかを指定します。 デフォルトは False です。
  • pointrend - セグメンテーション ヘッドの上部に PointRend アーキテクチャを使用するかどうかを指定します。 PointRend アーキテクチャの詳細については、PointRend の PDF をご参照ください。 デフォルトは False です。
  • pooling - 使用するピクセル埋め込みプール戦略。 デフォルトは mean です。
  • pyramid_sizes - それぞれの小区域に適用される畳み込みレイヤーの数とサイズです。 デフォルト値は [1,2,3,6] です。 この引数は、ピラミッド型解析ネットワーク モデルに固有のものです。
  • qkv_bias - トレーニングで QK ベクトル バイアスを使用するかどうかを指定します。 デフォルトは False です。
  • ratios - アンカー ボックスで使用する縦横比のリストです。 オブジェクト検出を行う場合、アンカー ボックスは予測対象のオブジェクトに最適な位置、形状、サイズを表します。 たとえば、この引数を [1.0, 1.0]、[1.0, 0.5] に設定すると、アンカー ボックスが正方形 (1:1) になるか、水平側が鉛直側の半分の長方形 (1:0.5) になります。 RetinaNet のデフォルトは [0.5,1,2] です。 シングル ショット検出器のデフォルトは [1.0, 1.0] です。
  • res_blocks - 残差ブロックの数。 これはオプションの整数値です。 デフォルトは 3 です。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
  • rpn_batch_size_per_image - 損失の計算で RPN のトレーニング中にサンプリングされたアンカーの数。 デフォルトは 256 です。
  • rpn_bg_iou_thresh - RPN のトレーニング中に負として見なすことができるようにする、アンカーと GT ボックスの間の最大 IoU。 デフォルトは 0.3 です。
  • rpn_fg_iou_thresh - RPN のトレーニング中に正として見なすことができるようにする、アンカーと GT ボックスの間の最小 IoU。 デフォルトは 0.7 です。
  • rpn_nms_thresh - RPN 提案の後処理に使用される NMS 閾値。 デフォルトは 0.7 です。
  • rpn_positive_fraction - RPN のトレーニング中のミニバッチにおける正のアンカーの比率。 デフォルトは 0.5 です。
  • rpn_post_nms_top_n_test - テスト中に NMS の適用後に保持する提案の数。 デフォルトは 1000 です。
  • rpn_post_nms_top_n_train - トレーニング中に NMS の適用後に保持する提案の数。 デフォルトは 2000 です。
  • rpn_pre_nms_top_n_test - テスト中に NMS の適用前に保持する提案の数。 デフォルトは 1000 です。
  • rpn_pre_nms_top_n_train - トレーニング中に NMS の適用前に保持する提案の数。 デフォルトは 2000 です。
  • scales - 各セルが拡大/縮小される縮尺レベルの数です。 デフォルト値は [1, 0.8, 0.63] です。
  • schedule - 使用するスケジュールのタイプを設定するオプションの引数。 オプションは、リニア、warmup10、warmup50、定数、jsd、余弦 です。 デフォルトはリニアです。 この引数は、バックボーン モデル パラメーター値が SR3 の場合のみサポートされます。
  • T - 位置エンコーディングに使用する期間。 デフォルトは 1000 です。
  • timesteps_of_interest - 対象の時間ステップのリスト。これにより、指定された時間ステップのリストに基づいて複数の時系列をフィルターします。 たとえば、データセットに時間ステップ 0、1、2、3 があるが時間ステップ 0、1、2 がトレーニングで使用されている場合、このパラメーターは [0,1,2]; the rest of the time-steps will be filtered out. に設定されます。
  • use_net - ピラミッド プーリングが完了した時点で U-Net デコーダーを使用してデータを復元するかどうかを指定します。 デフォルトは True です。 この引数は、ピラミッド型解析ネットワーク モデルに固有のものです。
  • vgg_loss - VGG フィーチャのマッチング損失を使用するかどうかを指定します。 3 バンドの画像でのみサポートされています。 デフォルトは True です。
  • zooms - 各グリッド セルが拡大/縮小されるズーム レベルの数です。 この引数を 1 に設定すると、すべてのグリッド セルが同じサイズまたはズーム レベルで維持されます。 ズーム レベルが 2 の場合は、すべてのグリッド セルが 2 倍の大きさになります (100 パーセントでズームされる)。 ズーム レベルのリストを指定すると、そのリスト内のすべての数値を使用して、すべてのグリッド セルが拡大/縮小されます。 デフォルトは 1 です。

モデル タイプ引数有効な値

Change detector

(ピクセル分類)

attention_type

PAM (Pyramid Attention Module) または BAM (Basic Attention Module)。 デフォルトは、PAM です。

chip_size

0 から画像サイズの間の整数。

monitor

valid_lossprecisionrecall、および f1

ConnectNet

(ピクセル分類)

chip_size

0 から画像サイズの間の整数。

gaussian_thresh

0.0 ~ 1.0。 デフォルト値は 0.76 です。

monitor

valid_lossaccuracymiou、および dice

mtl_model

linknet または hourglass

orient_bin_size

正の数値。 デフォルトは 20 です。

orient_theta

正の数値。 デフォルトは 8 です。

CycleGAN

(画像変換)

gen_blocks

正の整数。 デフォルトは 9 です。

lsgan

true または false。 デフォルトは、true です。

DeepLabv

(ピクセル分類)

chip_size

0 から画像サイズの間の整数。

class_balancing

true または false

dice_loss_average

micro または macro。 デフォルトは、micro です。

dice_loss_fraction

0 ~ 1 の浮動小数点値。 デフォルトは 0 です。

focal_loss

true または false

ignore_classes

有効なクラス値。

keep_dilation

true または false。 デフォルトは、false です。

mixup

true または false

monitor

valid_loss および accuracy

pointrend

true または false。 デフォルトは、false です。

FasterRCNN

(オブジェクトの検出)

box_batch_size_per_image

正の整数。 デフォルトは 512 です。

box_bg_iou_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。

box_detections_per_img

正の整数。 デフォルトは 100 です。

box_fg_iou_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。

box_nms_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。

box_positive_fraction

0 ~ 1 の浮動小数点値。 デフォルトは 0.25 です。

box_score_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.05 です。

rpn_batch_size_per_image

正の整数。 デフォルトは 256 です。

rpn_bg_iou_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.3 です。

rpn_fg_iou_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.7 です。

rpn_nms_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.7 です。

rpn_positive_fraction

0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。

rpn_post_nms_top_n_test

正の整数。 デフォルトは 1000 です。

rpn_post_nms_top_n_train

正の整数。 デフォルトは 2000 です。

rpn_pre_nms_top_n_test

正の整数。 デフォルトは 1000 です。

rpn_pre_nms_top_n_train

正の整数。 デフォルトは 2000 です。

フィーチャ分類器

(オブジェクトの分類)

backend

pytorch または tensorflow。 デフォルトは、pytorch です。

mixup

true または false。 デフォルトは、false です。

oversample

true または false。 デフォルトは、false です。

Image captioner

(画像変換)

chip_size

0 から画像サイズの間の整数。

decode_params 引数は、以下のパラメーターで構成されます。

  • embed_size
  • hidden_size
  • attention_size
  • teacher_forcing
  • dropout
  • pretrained_emb

デフォルトは、{'embed_size':100, 'hidden_size':100, 'attention_size':100, 'teacher_forcing':1, 'dropout':0.1, 'pretrained_emb':False} です。

monitor

valid_lossaccuracycorpus_bleu、および multi_label_fbeta

MaskRCNN

(オブジェクトの検出)

box_batch_size_per_image

正の整数。 デフォルトは 512 です。

box_bg_iou_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。

box_detections_per_img

正の整数。 デフォルトは 100 です。

box_fg_iou_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。

box_nms_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。

box_positive_fraction

0 ~ 1 の浮動小数点値。 デフォルトは 0.25 です。

box_score_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.05 です。

rpn_batch_size_per_image

正の整数。 デフォルトは 256 です。

rpn_bg_iou_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.3 です。

rpn_fg_iou_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.7 です。

rpn_nms_thresh

0 ~ 1 の浮動小数点値。 デフォルトは 0.7 です。

rpn_positive_fraction

0 ~ 1 の浮動小数点値。 デフォルトは 0.5 です。

rpn_post_nms_top_n_test

正の整数。 デフォルトは 1000 です。

rpn_post_nms_top_n_train

正の整数。 デフォルトは 2000 です。

rpn_pre_nms_top_n_test

正の整数。 デフォルトは 1000 です。

rpn_pre_nms_top_n_train

正の整数。 デフォルトは 2000 です。

MaXDeepLab

(パノプティック セグメンテーション)

n_masks

正の整数。 デフォルトは 30 です。

MMDetection

(オブジェクトの検出)

chip_size

0 から画像サイズの間の整数。

model

atsscarafecascade_rcnncascade_rpndcndeeplabv3detectorsdinodouble_headsdynamic_rcnnempirical_attentionfcosfoveaboxfsafghmhrnetlibra_rcnnnas_fcospafpnpisaregnetreppointsres2netsablvfnet

デフォルトは、deeplabv3 です。

model_weight

true または false

MMSegmentation

(ピクセル分類)

chip_size

0 から画像サイズの間の整数。

model

annapcnetccnetcgnetdeeplabv3deeplabv3plusdmnet dnlnetemanetfastscnnfcngcnethrnetmask2formermobilenet_v2nonlocal_netocrnetprithvi100mpsanetpspnetresnestsem_fpnunetupernet

デフォルトは、mask2former です。

model_weight

true または false

Multi Task Road Extractor

(ピクセル分類)

chip_size

0 から画像サイズの間の整数。

gaussian_thresh

0.0 ~ 1.0。 デフォルト値は 0.76 です。

monitor

valid_lossaccuracymiou、および dice

mtl_model

linknet または hourglass

orient_bin_size

正の数値。 デフォルトは 20 です。

orient_theta

正の数値。 デフォルトは 8 です。

Pix2Pix

(画像変換)

perceptual_loss

true または false。 デフォルトは、false です。

Pix2PixHD

(画像変換)

gen_network

local または global。 デフォルトは、local です。

feat_loss

true または false。 デフォルトは、true です。

lambda_feat

正の整数値。 デフォルトは 10 です。

lambda_l1

正の整数値。 デフォルトは 100 です。

lsgan

true または false。 デフォルトは、true です。

n_blocks_global

正の整数値。 デフォルトは 9 です。

n_blocks_local

正の整数値。 デフォルトは 3 です。

n_downsample_global

正の整数値。 デフォルトは 4 です。

n_dscr

正の整数値。 デフォルトは 2 です。

n_dscr_filters

正の整数値。 デフォルトは 64 です。

n_gen_filters

正の整数値。 デフォルトは 64 です。

n_layers_dscr

正の整数値。 デフォルトは 3 です。

n_local_enhancers

正の整数値。 デフォルトは 1 です。

norm

instance または batch。 デフォルトは、instance です。

vgg_loss

true または false。 デフォルトは、true です。

PSETAE

(ピクセル分類)

channels_of_interest

バンド番号のリスト (正の整数)。

d_k

正の整数値。 デフォルトは 32 です。

dropout

0 ~ 1 の浮動小数点値。 デフォルトは 0.2 です。

min_points

64 の整数倍。

mlp1

正の整数のリスト。 デフォルトは、32, 64 です。

mlp2

正の整数のリスト。 デフォルトは、128, 128 です。

mlp4

正の整数のリスト。 デフォルトは、64, 32 です。

n_head

正の整数値。 デフォルトは 4 です。

pooling

meanstdmaxmin

T

正の整数値。 デフォルトは 1000 です。

timesteps_of_interest

正の整数のリスト。

ピラミッド シーン解析ネットワーク

(ピクセル分類)

chip_size

0 から画像サイズの間の整数。

class_balancing

true または false

dice_loss_average

micro または macro。 デフォルトは、micro です。

dice_loss_fraction

0 ~ 1 の浮動小数点値。 デフォルトは 0 です。

focal_loss

true または false

ignore_classes

有効なクラス値。

keep_dilation

true または false。 デフォルトは、false です。

monitor

valid_loss または accuracy

mixup

true または false

pointrend

true または false。 デフォルトは、false です。

pyramid_sizes

[畳み込みレイヤー 1, 畳み込みレイヤー 2, ... , 畳み込みレイヤー n]

use_net

true または false

RetinaNet

(オブジェクトの検出)

chip_size

0 から画像サイズの間の整数。

monitor

valid_loss または average_precision

ratios

比率値 1, 比率値 2, 比率値 3

デフォルトは、0.5,1,2 です。

scales

[縮尺値 1, 縮尺値 2, 縮尺値 3]

デフォルトは、[1, 0.8, 0.63] です。

SAMLoRA

(ピクセル分類)

class_balancing

true または false

ignore_classes

有効なクラス値。

シングル ショット検出器

(オブジェクトの検出)

backend

pytorch または tensorflow。 デフォルトは、pytorch です。

bias

浮動小数点値。 デフォルトは -0.4 です。

chip_size

0 から画像サイズの間の整数。 デフォルトは 0.3 です。

drop

0 ~ 1 の浮動小数点値。

focal_loss

true または false。 デフォルトは、false です。

grids

0 より大きい整数値。

location_loss_factor

0 ~ 1 の浮動小数点値。

monitor

valid_loss または average_precision

ratios

[水平値, 垂直値]

zooms

ズーム値 (1.0 が標準縮尺)。

Super Resolution with SR3 backbone

(画像変換)

attn_res

0 より大きい整数。 デフォルトは 16 です。

channel_mults

整数の乗数セット。デフォルトは [1、2、4、4、8、8] です。

downsample_factor

正の整数値。 デフォルトは 4 です。

dropout

浮動小数点値。 デフォルトは 0 です。

inner_channel

0 より大きい整数値。 デフォルトは 64 です。

linear_start

時間を表す整数。 デフォルトは 1e-02 です。

linear_end

時間を表す整数。 デフォルトは 1e-06 です。

n_timestep 

0 より大きい整数値。 デフォルトは 1000 です。

norm_groups

0 より大きい整数値。 デフォルトは 32 です。

res_blocks

0 より大きい整数値。 デフォルトは 3 です。

schedule 

linearwarmup10warmup50constjsd、または cosine

デフォルトは、linear です。

Super Resolution with SR3_UViT backbone

(画像変換)

depth

正の整数点値。 デフォルトは 17 です。

embed_dim

正の整数点値。 デフォルトは 768 です。

mlp_ratio

正の浮動小数点値。 デフォルトは 4.0 です。

num_heads

正の整数点値。 デフォルトは 12 です。

patch_size

正の整数点値。 デフォルトは 16 です。

qkv_bias

true または false。 デフォルトは、false です。

U-Net

(ピクセル分類)

chip_size

0 から画像サイズの間の整数。

class_balancing

true または false

dice_loss_average

micro または macro。 デフォルトは、micro です。

dice_loss_fraction

0 ~ 1 の浮動小数点値。 デフォルトは 0 です。

focal_loss

true または false

ignore_classes

有効なクラス値。

monitor

valid_loss または accuracy

mixup

true または false

推論引数

次の引数を使用して、ディープ ラーニング モデルを推論用にどのようにトレーニングするかを制御できます。 [モデル定義] パラメーターからの情報が、推論ツールの [引数] パラメーターの設定に使用されます。 これらの引数はモデル アーキテクチャによって異なります。 ArcGIS 事前トレーニング済みモデルとカスタム ディープ ラーニング モデルでは、このツールでサポートされている追加の引数を利用できることがあります。

引数推測タイプ有効な値

batch_size

モデル推論の各ステップで処理された画像タイルの数。 これは、お使いのグラフィックス カードのメモリに応じて異なります。 この引数はすべてのモデル アーキテクチャで使用できます。

オブジェクトの分類

ピクセルの分類

変化検出

オブジェクトの検出

0 より大きい整数値。通常は 2 の累乗 (2n) の整数です。

direction

画像が 2 つのドメイン間で変換されます。 この引数の詳細については、「CycleGAN の機能」をご参照ください。

この引数は CycleGAN アーキテクチャでのみ使用できます。

ピクセルの分類

利用可能なオプションは AtoBBtoA です。

exclude_pad_detections

\true の場合、画像チップのパディングされた領域にあるエッジ付近で切り捨てられる可能性のある検出をフィルターします。

この引数は SSD、RetinaNet、YOLOv3、DETReg、MMDetection、Faster RCNN のみで使用できます。

オブジェクトの検出

true または false

merge_policy

拡張された予測のマージに関するポリシー。 これは、テスト時間の延長が使用される場合に限り適用できます。

[ディープ ラーニングを使用したピクセルの分類 (Classify Pixels Using Deep Learning)] ツールの場合、この引数は MultiTaskRoadExtractor および ConnectNet アーキテクチャで使用できます。 IsEdgeDetection がモデルの .emd ファイルに存在する場合、BDCNEdgeDetector、HEDEdgeDetector、MMSegmentation アーキテクチャでも使用できます。

[ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールの場合、この引数は MaskRCNN でのみ使用できます。

ピクセルの分類

オブジェクトの検出

使用可能なオプションは meanmax、および min です。

nms_overlap

2 つの重複したフィーチャの最大オーバーラップ率。結合領域に対する交差領域の比率として定義されます。 この引数はすべてのモデル アーキテクチャで使用できます。

オブジェクトの検出

0.0 ~ 1.0 の浮動小数点値。 デフォルトは 0.1 です。

output_classified_raster

出力ラスターへのパス。 この引数は MaXDeepLab でのみ使用できます。

オブジェクトの検出

出力分類ラスターのファイル パスと名前。

padding

隣接するタイルの予測がブレンドされる画像タイルの境界のピクセル数。 出力を滑らかにすると同時にアーティファクトを減らすには、この値を大きくします。 パディングの最大値には、タイル サイズの値の半分を設定できます。 この引数はすべてのモデル アーキテクチャで使用できます。

ピクセルの分類

変化検出

オブジェクトの検出

0 より大きくタイル サイズの値の半分より小さい整数値。

predict_background

true の場合、背景クラスも分類されます。 この引数は UNET、PSPNET、DeepLab、MMSegmentation で使用できます。

ピクセルの分類

true または false

return_probability_raster

true の場合、確率ラスターを出力します。 確率ラスターは、関心のある変数が指定された閾値を上回る、または下回る可能性をピクセルで指定するラスターです。

モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上の場合、MultiTaskRoadExtractor および ConnectNet アーキテクチャを利用できます。 モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上であり、IsEdgeDetection が存在する場合は、BDCNEdgeDetector、HEDEdgeDetector、および MMSegmentation アーキテクチャも利用できます。

ピクセルの分類

true または false

score_threshold

この信頼度スコアを上回る予測が、結果に追加されます。 この引数はすべてのモデル アーキテクチャで使用できます。

オブジェクトの分類

0 ~ 1.0

test_time_augmentation

予測中にテスト時間の延長を実行します。 true の場合、入力画像の反転および回転バリアントの予測は、最終出力にマージされます。 この引数はほとんどのモデル アーキテクチャで使用できます。

オブジェクトの分類

ピクセルの分類

true または false

threshold

この閾値よりも信頼度スコアが高い予測が、結果に追加されます。

[ディープ ラーニングを使用したピクセルの分類 (Classify Pixels Using Deep Learning)] ツールの場合、モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上の場合、MultiTaskRoadExtractor および ConnectNet アーキテクチャを利用できます。 モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上であり、IsEdgeDetection が存在する場合は、BDCNEdgeDetector、HEDEdgeDetector、および MMSegmentation アーキテクチャも利用できます。

[ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールの場合、この引数はすべてのモデル アーキテクチャで使用できます。

ピクセルの分類

オブジェクトの検出

0 ~ 1.0。

thinning

予測されたエッジを細線化またはスケルトン化します。

IsEdgeDetection がモデルの .emd ファイルに存在する場合、BDCNEdgeDetector、HEDEdgeDetector、MMSegmentation アーキテクチャで使用できます。

ピクセルの分類

true または false

tile_size

tile_size - 予測のために画像が分割される画像タイルの幅と高さ。

[ディープ ラーニングを使用したピクセルの分類 (Classify Pixels Using Deep Learning)] ツールの場合、この引数は CycleGAN アーキテクチャでのみ使用できます。

[ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールの場合、この引数は MaskRCNN でのみ使用できます。

ピクセルの分類

オブジェクトの検出

0 より大きく画像のサイズより小さい整数値。

関連トピック


このトピックの内容
  1. トレーニング引数
  2. 推論引数