Argumentos del aprendizaje profundo

Disponible con licencia de Image Analyst.

Los argumentos son una de las muchas formas de controlar cómo se entrenan y utilizan los modelos de aprendizaje profundo. En la primera tabla siguiente figuran los argumentos de modelos admitidos en el entrenamiento de modelos de aprendizaje profundo. En la segunda tabla figuran los argumentos para controlar la forma de utilizar los modelos de aprendizaje profundo en la inferencia.

Argumentos de entrenamiento

En la herramienta Entrenar modelo de aprendizaje profundo se encuentran disponibles los siguientes argumentos para entrenar modelos de aprendizaje profundo. Estos argumentos varían dependiendo de la arquitectura del modelo. Puede cambiar los valores de estos argumentos para entrenar un modelo.

Tipo de modeloArgumentoValores válidos

Detector de cambios (clasificación de píxeles)

attention_type

PAM (módulo de atención piramidal) o BAM (módulo de atención básica).

chip_size

Enteros entre 0 y tamaño de imagen.

monitor

valid_loss, precision, recall y f1.

ConnectNet (clasificación de píxeles)

chip_size

Enteros entre 0 y tamaño de imagen.

gaussian_thresh

0,0 a 1,0. El valor predeterminado es 0,76.

monitor

valid_loss, accuracy, miou y dice.

mtl_model

linknet o hourglass.

orient_bin_size

Número positivo. El valor predeterminado es 20.

orient_theta

Número positivo. El valor predeterminado es 8.

DeepLabv3 (clasificación de píxeles)

chip_size

Enteros entre 0 y tamaño de imagen.

class_balancing

true o false.

focal_loss

true o false.

ignore_classes

Valores de clase válidos.

monitor

valid_loss y accuracy.

mezcla

true o false.

Subtitulador de imágenes (traducción de imágenes)

chip_size

Enteros entre 0 y tamaño de imagen.

El argumento decode_params se compone de los siguientes parámetros:

  • embed_size
  • hidden_size
  • attention_size
  • teacher_forcing
  • fracaso
  • pretrained_emb

El valor predeterminado es {'embed_size':100, 'hidden_size':100, 'attention_size':100, 'teacher_forcing':1, 'dropout':0.1, 'pretrained_emb':False}.

monitor

valid_loss, accuracy, corpus_bleu y multi_label_fbeta.

MMDetection (detección de objetos)

chip_size

Enteros entre 0 y tamaño de imagen.

modelo

atss, carafe, cascade_rcnn, cascade_rpn, dcn, detectors, double_heads, dynamic_rcnn, empirical_attention, fcos, foveabox, fsaf, ghm, hrnet, libra_rcnn, nas_fcos, pafpn, pisa, regnet, reppoints, res2net, sabl y vfnet.

model_weight

true o false.

MMSegmentation (clasificación de píxeles)

chip_size

Enteros entre 0 y tamaño de imagen.

modelo

ann, apcnet, ccnet, cgnet, danet, deeplabv3, deeplabv3plus, dmnet , dnlnet, emanet, encnet, fastscnn, fcn, gcnet, hrnet, mobilenet_v2, mobilenet_v3, nonlocal_net, ocrnet, ocrnet_base, pointrend, psanet, pspnet, resnest, sem_fpn, unet y upernet.

model_weight

true o false.

Extractor de carreteras de varias tareas (clasificación de píxeles)

chip_size

Enteros entre 0 y tamaño de imagen.

gaussian_thresh

0,0 a 1,0. El valor predeterminado es 0,76.

monitor

valid_loss, accuracy, miou y dice.

mtl_model

linknet o hourglass.

orient_bin_size

Número positivo. El valor predeterminado es 20.

orient_theta

Número positivo. El valor predeterminado es 8.

Red de análisis de escenas piramidales (clasificación de píxeles)

chip_size

Enteros entre 0 y tamaño de imagen.

class_balancing

true o false.

focal_loss

true o false.

ignore_classes

Valores de clase válidos.

monitor

valid_loss o accuracy.

mezcla

true o false.

pyramid_sizes

[capa de convolución 1, capa de convolución 2, ... , capa de convolución n]

use_net

true o false.

RetinaNet (detección de objetos)

chip_size

Enteros entre 0 y tamaño de imagen.

monitor

valid_loss o average_precision.

relaciones

Valor de relación 1, valor de relación 2, valor de relación 3.

El valor predeterminado es 0.5,1,2.

escalas

[valor de escala 1, valor de escala 2, valor de escala 3]

El valor predeterminado es [1, 0.8, 0.63].

SAMLoRA (clasificación de píxeles)

class_balancing

true o false.

ignore_classes

Valores de clase válidos.

Single Shot Detector (detección de objetos)

chip_size

Enteros entre 0 y tamaño de imagen.

cuadrículas

Valores enteros mayores que 0.

monitor

valid_loss o average_precision.

relaciones

[valor horizontal, valor vertical]

zooms

Valor de zoom en el que 1,0 es un zoom normal.

Superresolución con base SR3 (traducción de imágenes)

attn_res

Enteros mayores que 0. El valor predeterminado es 16.

channel_mults 

Conjuntos de multiplicadores enteros El valor predeterminado es [1, 2, 4, 4, 8, 8].

fracaso

Valor de punto flotante. El valor predeterminado es 0.

inner_channel

Valor entero mayor que 0. El valor predeterminado es 64.

linear_start

Entero de hora. El valor predeterminado es 1e-02.

linear_end 

Entero de hora. El valor predeterminado es 1e-06.

n_timestep 

Valor entero mayor que 0. El valor predeterminado es 1000.

norm_groups 

Valor entero mayor que 0. El valor predeterminado es 32.

res_blocks

Valor entero mayor que 0. El valor predeterminado es 3.

programación

linear, warmup10, warmup50, const, jsd o cosine.

El valor predeterminado es lineal.

U-Net (clasificación de píxeles)

chip_size

Enteros entre 0 y tamaño de imagen.

class_balancing

true o false.

focal_loss

true o false.

ignore_classes

Valores de clase válidos.

monitor

valid_loss o accuracy.

mezcla

true o false.

Argumentos de inferencia

Los siguientes argumentos están disponibles para controlar cómo entrenar modelos de aprendizaje profundo para inferencia. La información del parámetro Definición de modelo se utilizará para rellenar Argumentos en las herramientas de inferencia. Estos argumentos varían dependiendo de la arquitectura del modelo. Los modelos preentrenados de ArcGIS y los modelos de aprendizaje profundo personalizados pueden tener argumentos adicionales que son compatibles con las herramientas.

ArgumentoTipo de inferenciaValores válidos

batch_size

Clasificar objetos

Clasificar píxeles

Detectar cambios

Detectar objetos

Valores enteros mayores que 0; suele ser un entero que es una potencia de 2.

dirección

Clasificar píxeles

Las opciones disponibles son AtoB y BtoA.

El argumento solo está disponible para la arquitectura CycleGAN.

exclude_pad_detections

Detectar objetos

true o false.

El argumento está disponible para SSD, RetinaNet, YOLOv3, DETReg, MMDetection y Faster RCNN solamente.

merge_policy

Clasificar píxeles

Detectar objetos

Las opciones disponibles son mean, max y min.

En el caso de la herramienta Clasificar píxeles con aprendizaje profundo, el argumento está disponible para las arquitecturas Multi Task Road Extractor y ConnectNet. Si IsEdgeDetection está presente en el archivo del modelo .emd, BDCN Edge Detector, HED Edge Detector y MMSegmentation también son arquitecturas disponibles.

En el caso de la herramienta Detectar objetos con aprendizaje profundo, el argumento solo está disponible para MaskRCNN.

n_timestep

Clasificar píxeles

Valor entero mayor que 0. El valor predeterminado es 200.

El argumento está disponible para modelos de súperresolución con base SR3.

nms_overlap

Detectar objetos

Valor de punto flotante de 0,0 a 1,0. El valor predeterminado es 0,1.

output_classified_raster

Detectar objetos

Nombre y ruta del archivo del raster clasificado de salida.

El argumento solo está disponible para MaXDeepLab.

relleno

Clasificar píxeles

Detectar cambios

Detectar objetos

Valores enteros mayores que 0 y menores que la mitad del valor de tamaño de tesela.

predict_background

Clasificar píxeles

true o false.

El argumento está disponible para UNET, PSPNET, DeepLab y MMSegmentation.

return_probability_raster

Clasificar píxeles

true o false.

Si ArcGISLearnVersion pertenece a la versión 1.8.4 u otra posterior en el archivo .emd del modelo, las arquitecturas Multi Task Road Extractor y ConnectNet están disponibles. Si ArcGISLearnVersion pertenece a la versión 1.8.4 u otra posterior yIsEdgeDetection está presente en el archivo .emd del modelo, las arquitecturas BDCN Edge Detector, HED Edge Detector y MMSegmentation también están disponibles.

sampling_type

Clasificar píxeles

ddim y ddpm.

El valor predeterminado es ddim.

El argumento está disponible para modelos de súperresolución con base SR3.

programar

Clasificar píxeles

linear, warmup10, warmup50, const, jsd o cosine.

El valor predeterminado se establece en el mismo valor que el modelo en el que se entrenó.

El argumento está disponible para modelos de súperresolución con base SR3.

score_threshold

Clasificar objetos

0 a 1,0.

test_time_augmentation

Clasificar objetos

Clasificar píxeles

true o false.

umbral

Clasificar píxeles

Detectar objetos

0 a 1,0.

En el caso de la herramienta Clasificar píxeles con aprendizaje profundo, si ArcGISLearnVersion pertenece a la versión 1.8.4 u otra posterior en el archivo .emd del modelo, las arquitecturas MultiTaskRoadExtractor y ConnectNet están disponibles. Si ArcGISLearnVersion pertenece a la versión 1.8.4 u otra posterior yIsEdgeDetection está presente en el archivo .emd del modelo, las arquitecturas BDCNEdgeDetector, HEDEdgeDetector y MMSegmentation también están disponibles.

En el caso de la herramienta Detectar objetos con aprendizaje profundo, el argumento está disponible para todas las arquitecturas de modelos.

simplificación

Clasificar píxeles

true o false.

Si IsEdgeDetection está presente en el archivo .emd del modelo, BDCNEdgeDetector, HEDEdgeDetector y MMSegmentation son arquitecturas disponibles.

tile_size

Clasificar píxeles

Detectar objetos

Valores enteros mayores que 0 y menores que el tamaño de la imagen.

En el caso de la herramienta Clasificar píxeles mediante aprendizaje profundo, el argumento solo está disponible para la arquitectura CycleGAN.

En el caso de la herramienta Detectar objetos con aprendizaje profundo, el argumento solo está disponible para MaskRCNN.

Temas relacionados