ディープ ラーニング引数

Image Analyst ライセンスで利用できます。

ディープ ラーニング モデルをどのようにトレーニングして使用するかを制御する方法は多数あり、引数もその 1 つです。 以下の 1 つ目の表には、ディープ ラーニング モデルのトレーニングについてサポートされているモデル引数が一覧表示されています。 2 つ目の表には、ディープ ラーニング モデルを推論でどのように使用するかを制御する引数が一覧表示されています。

トレーニング引数

次の引数は、ディープ ラーニング モデルをトレーニングする際に [ディープ ラーニング モデルのトレーニング (Train Deep Learning Model)] ツールで使用できます。 これらの引数はモデル アーキテクチャによって異なります。 これらの引数の値を変えてモデルをトレーニングすることができます。

モデル タイプ引数有効な値

変化検出器 (ピクセル分類)

attention_type

PAM (Pyramid Attention Module) または BAM (Basic Attention Module)。

chip_size

0 から画像サイズの間の整数。

monitor

valid_lossprecisionrecall、および f1

ConnectNet (ピクセル分類)

chip_size

0 から画像サイズの間の整数。

gaussian_thresh

0.0 ~ 1.0。 デフォルト値は 0.76 です。

monitor

valid_lossaccuracymiou、および dice

mtl_model

linknet または hourglass

orient_bin_size

正の数値。 デフォルトは 20 です。

orient_theta

正の数値。 デフォルトは 8 です。

DeepLabv3 (ピクセル分類)

chip_size

0 から画像サイズの間の整数。

class_balancing

true または false

focal_loss

true または false

ignore_classes

有効なクラス値。

monitor

valid_loss および accuracy

mixup

true または false

Image captioner (画像変換)

chip_size

0 から画像サイズの間の整数。

decode_params 引数は、以下のパラメーターで構成されます。

  • embed_size
  • hidden_size
  • attention_size
  • teacher_forcing
  • dropout
  • pretrained_emb

デフォルトは、{'embed_size':100, 'hidden_size':100, 'attention_size':100, 'teacher_forcing':1, 'dropout':0.1, 'pretrained_emb':False} です。

monitor

valid_lossaccuracycorpus_bleu、および multi_label_fbeta

MMDetection (オブジェクト検出)

chip_size

0 から画像サイズの間の整数。

model

atsscarafecascade_rcnncascade_rpndcndetectorsdouble_headsdynamic_rcnnempirical_attentionfcosfoveaboxfsafghmhrnetlibra_rcnnnas_fcospafpnpisaregnetreppointsres2netsabl、および vfnet

model_weight

true または false

MMSegmentation (ピクセル分類)

chip_size

0 から画像サイズの間の整数。

model

annapcnetccnetcgnetdanetdeeplabv3deeplabv3plusdmnet dnlnetemanetencnetfastscnnfcngcnethrnetmobilenet_v2mobilenet_v3nonlocal_netocrnetocrnet_basepointrendpsanetpspnetresnestsem_fpnunet、および upernet

model_weight

true または false

Multi Task Road Extractor (ピクセル分類)

chip_size

0 から画像サイズの間の整数。

gaussian_thresh

0.0 ~ 1.0。 デフォルト値は 0.76 です。

monitor

valid_lossaccuracymiou、および dice

mtl_model

linknet または hourglass

orient_bin_size

正の数値。 デフォルトは 20 です。

orient_theta

正の数値。 デフォルトは 8 です。

Pyramid Scene Parsing Network (ピクセル分類)

chip_size

0 から画像サイズの間の整数。

class_balancing

true または false

focal_loss

true または false

ignore_classes

有効なクラス値。

monitor

valid_loss または accuracy

mixup

true または false

pyramid_sizes

[畳み込みレイヤー 1, 畳み込みレイヤー 2, ... , 畳み込みレイヤー n]

use_net

true または false

RetinaNet (オブジェクト検出)

chip_size

0 から画像サイズの間の整数。

monitor

valid_loss または average_precision

ratios

比率値 1, 比率値 2, 比率値 3

デフォルトは、0.5,1,2 です。

scales

[縮尺値 1, 縮尺値 2, 縮尺値 3]

デフォルトは、[1, 0.8, 0.63] です。

SAMLoRA (ピクセル分類)

class_balancing

true または false

ignore_classes

有効なクラス値。

シングル ショット検出器 (オブジェクト検出)

chip_size

0 から画像サイズの間の整数。

grids

0 より大きい整数値。

monitor

valid_loss または average_precision

ratios

[水平値, 垂直値]

zooms

ズーム値 (1.0 が標準縮尺)。

Super Resolution with SR3 backbone (画像変換)

attn_res

0 より大きい整数。 デフォルトは 16 です。

channel_mults 

整数の乗数セット。デフォルトは [1、2、4、4、8、8] です。

dropout

浮動小数点値。 デフォルトは 0 です。

inner_channel

0 より大きい整数値。 デフォルトは 64 です。

linear_start

時間を表す整数。 デフォルトは 1e-02 です。

linear_end 

時間を表す整数。 デフォルトは 1e-06 です。

n_timestep 

0 より大きい整数。 デフォルトは 1000 です。

norm_groups 

0 より大きい整数。 デフォルトは 32 です。

res_blocks

0 より大きい整数。 デフォルトは 3 です。

schedule 

linearwarmup10warmup50constjsd、または cosine

デフォルトはリニアです。

U-Net (ピクセル分類)

chip_size

0 から画像サイズの間の整数。

class_balancing

true または false

focal_loss

true または false

ignore_classes

有効なクラス値。

monitor

valid_loss または accuracy

mixup

true または false

推論引数

次の引数を使用して、ディープ ラーニング モデルを推論用にどのようにトレーニングするかを制御できます。 [モデル定義] パラメーターからの情報が、推論ツールの引数の設定に使用されます。 これらの引数はモデル アーキテクチャによって異なります。 ArcGIS 事前トレーニング済みモデルとカスタム ディープ ラーニング モデルでは、このツールでサポートされている追加の引数を利用できることがあります。

引数推測タイプ有効な値

batch_size

オブジェクトの分類

ピクセルの分類

変化検出

オブジェクトの検出

0 より大きい整数値。通常は 2 の累乗 (2n) の整数です。

方向

ピクセルの分類

利用可能なオプションは AtoBBtoA です。

この引数は CycleGAN アーキテクチャでのみ使用できます。

exclude_pad_detections

オブジェクトの検出

true または false

この引数は SSD、RetinaNet、YOLOv3、DETReg、MMDetection、Faster RCNN のみで使用できます。

merge_policy

ピクセルの分類

オブジェクトの検出

使用可能なオプションは meanmax、および min です。

[ディープ ラーニングを使用したピクセルの分類 (Classify Pixels Using Deep Learning)] ツールの場合、この引数は MultiTaskRoadExtractor および ConnectNet アーキテクチャで使用できます。 IsEdgeDetection がモデルの .emd ファイルに存在する場合、BDCN Edge Detector、HED Edge Detector、および MMSegmentation アーキテクチャも利用できます。

[ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールの場合、この引数は MaskRCNN でのみ使用できます。

n_timestep

ピクセルの分類

0 より大きい整数値。 デフォルトは 200 です。

この引数は、Super Resolution with SR3 backbone モデルで使用できます。

nms_overlap

オブジェクトの検出

0.0 ~ 1.0 の浮動小数点値。 デフォルトは 0.1 です。

output_classified_raster

オブジェクトの検出

出力分類ラスターのファイル パスと名前。

この引数は MaXDeepLab でのみ使用できます。

padding

ピクセルの分類

変化検出

オブジェクトの検出

0 より大きくタイル サイズの値の半分より小さい整数値。

predict_background

ピクセルの分類

true または false

この引数は UNET、PSPNET、DeepLab、MMSegmentation で使用できます。

return_probability_raster

ピクセルの分類

true または false

モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上の場合、Multi Task Road Extractor および ConnectNet アーキテクチャを利用できます。 モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上であり、IsEdgeDetection が存在する場合は、BDCNEdgeDetector、HEDEdgeDetector、および MMSegmentation アーキテクチャも利用できます。

sampling_type

ピクセルの分類

ddim および ddpm

デフォルトは、ddim です。

この引数は、Super Resolution with SR3 backbone モデルで使用できます。

スケジュール

ピクセルの分類

linearwarmup10warmup50constjsd、または cosine

デフォルトは、トレーニングされたモデルと同じ値に設定されています。

この引数は、Super Resolution with SR3 backbone モデルで使用できます。

score_threshold

オブジェクトの分類

0 ~ 1.0。

test_time_augmentation

オブジェクトの分類

ピクセルの分類

true または false

threshold

ピクセルの分類

オブジェクトの検出

0 ~ 1.0。

[ディープ ラーニングを使用したピクセルの分類 (Classify Pixels Using Deep Learning)] ツールの場合、モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上の場合、MultiTaskRoadExtractor および ConnectNet アーキテクチャを利用できます。 モデルの .emd ファイルで ArcGISLearnVersion が 1.8.4 以上であり、IsEdgeDetection が存在する場合は、BDCNEdgeDetector、HEDEdgeDetector、および MMSegmentation アーキテクチャも利用できます。

[ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールの場合、この引数はすべてのモデル アーキテクチャで使用できます。

thinning

ピクセルの分類

true または false

IsEdgeDetection がモデルの .emd ファイルに存在する場合、BDCNEdgeDetector、HEDEdgeDetector、MMSegmentation アーキテクチャで使用できます。

tile_size

ピクセルの分類

オブジェクトの検出

0 より大きく画像のサイズより小さい整数値。

[ディープ ラーニングを使用したピクセルの分類 (Classify Pixels Using Deep Learning)] ツールの場合、この引数は CycleGAN アーキテクチャでのみ使用できます。

[ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールの場合、この引数は MaskRCNN でのみ使用できます。

関連トピック


このトピックの内容
  1. トレーニング引数
  2. 推論引数