Etiqueta | Explicación | Tipo de datos |
Tipo de predicción
| Especifica el modo de funcionamiento de la herramienta. La herramienta puede ejecutarse para entrenar un modelo solo para evaluar rendimientos, predecir entidades o crear una superficie de predicción.
| String |
Entidades de entrenamiento de entrada
| La capaque contiene el parámetro Variable para predecir y los campos de las variables explicativas de entrenamiento. | Record Set |
Nombre de entidades de salida
(Opcional) | El nombre de la capa de entidades de salida. | String |
Variable para predecir
(Opcional) | La variable del parámetro Entidades de entrenamiento de entrada que contiene los valores que se desean usar para entrenar el modelo. Este campo contiene valores (de entrenamiento) conocidos de la variable que se usará para predecir en ubicaciones desconocidas. | Field |
Tratar variable como variable de categorías (Opcional) | Especifica si Variable para predecir es una variable de categorías.
| Boolean |
Variables explicativas
(Opcional) | Una lista de campos que representan a las variables explicativas que ayudan a predecir el valor o la categoría de Variable para predecir. Active la casilla de verificación De categorías en el caso de las variables que representen clases o categorías (tales como cobertura de suelo, presencia o ausencia). | Value Table |
Crear tabla de importancia variable
(Opcional) | Especifica si la tabla de salida contendrá información que describe la importancia de cada variable explicativa utilizada en el modelo.
| Boolean |
Entidades de predicción de entrada (Opcional) | Una capa de entidades que representa las ubicaciones en las que se realizarán predicciones. Esta capa de entidades también debe contener las variables explicativas proporcionadas como campos que se correspondan con las utilizadas de los datos de entrenamiento. | Record Set |
Variables explicativas coincidentes
(Opcional) | Una lista de Variables explicativas especificadas de Entidades de entrenamiento de entrada de la derecha y sus campos correspondientes de Entidades de predicción de entrada de la izquierda. | Value Table |
Número de árboles
(Opcional) | La cantidad de árboles que se crearán en el modelo de bosque. Un mayor número de árboles por lo general dará lugar a una predicción de modelo más precisa, pero el modelo tardará más en calcularse. El número predeterminado de árboles es de 100. | Long |
Tamaño mínimo de hoja
(Opcional) | El número mínimo de observaciones requeridas para conservar una hoja (es decir, el nodo terminal de un árbol que no tiene más divisiones). El mínimo predeterminado para regresión es 5 y el mínimo predeterminado para clasificación es 1. En el caso de datos muy grandes, si aumenta estos números se reducirá el tiempo de ejecución de la herramienta. | Long |
Profundidad máxima de árbol
(Opcional) | El número máximo de divisiones que se realizarán en un árbol. Si se utiliza una profundidad máxima grande, se podrán crear más divisiones, lo cual puede aumentar las probabilidades de exceso de ajuste en el modelo. El valor predeterminado se basa en datos y depende del número de árboles creados y el número de variables incluidas. | Long |
Datos disponibles por árbol (%)
(Opcional) | El porcentaje de Entidades de entrenamiento de entrada utilizadas para cada árbol de decisión. El valor predeterminado es del 100 por cien de los datos. Las muestras de cada árbol se toman aleatoriamente a partir de dos tercios de los datos especificados. Cada árbol de decisión del bosque se crea con una muestra o un subconjunto aleatorios (aproximadamente dos tercios) de los datos de entrenamiento disponibles. Si utiliza un porcentaje menor de los datos de entrada para cada árbol de decisión, se aumenta la velocidad de la herramienta si los datasets son muy grandes. | Long |
Número de variables muestreadas aleatoriamente
(Opcional) | El número de variables explicativas utilizadas para crear cada árbol de decisión. Cada árbol de decisión del bosque se crea con un subconjunto aleatorio de las variables explicativas especificadas. Al aumentar el número de variables utilizadas en cada árbol de decisión, aumentarán también las probabilidades de exceso de ajuste en el modelo, especialmente si existen una o varias variables dominantes. Una práctica habitual consiste en utilizar la raíz cuadrada del número total de variables explicativas si Variable para predecir es numérica, o bien en dividir el número total de variables explicativas entre 3 si Variable para predecir es de categorías. | Long |
Datos de entrenamiento excluidos para la validación (%) (Opcional) | El porcentaje (entre el 10 y el 50 por ciento) de las Entidades de entrenamiento de entrada que se deben reservar como el dataset de prueba para la validación. El modelo se entrenará sin este subconjunto aleatorio de datos, y los valores observados para esas entidades se compararán con los valores predichos. El valor predeterminado es del 10 por ciento. | Long |
Almacenamiento de datos
(Opcional) | Especifica el ArcGIS Data Store en el que se guardará la salida. El valor predeterminado es Big data store espaciotemporal. Todos los resultados almacenados en un big data store espaciotemporal se almacenarán en WGS84. Los resultados almacenados en un data store relacional mantendrán su sistema de coordenadas.
| String |
Salida derivada
Etiqueta | Explicación | Tipo de datos |
Entidades de entrenamiento de salida | La salida que contiene las variables de entrada utilizadas para el entrenamiento, así como la variable observada para predecir el parámetro y las predicciones de acompañamiento que se pueden utilizar para evaluar con mayor profundidad el rendimiento del modelo. | Conjunto de registros |
Tabla Variable de Importancia | Una tabla que contiene información que describe la importancia de cada variable explicativa que se va a utilizar en el modelo creado. | Conjunto de registros |
Entidades predichas de salida | Una capa que recibirá las predicciones del modelo. | Conjunto de registros |