Etiqueta | Explicación | Tipo de datos |
Tipo de predicción | Especifica el modo de funcionamiento de la herramienta. La herramienta puede ejecutarse para entrenar un modelo solo para evaluar rendimientos, predecir entidades o crear una superficie de predicción.
| String |
Entidades de entrenamiento de entrada | La clase de entidad que contiene el valor del parámetro Variable para predecir y, opcionalmente, las variables explicativas de entrenamiento provenientes de los campos. | Feature Layer |
Variable para predecir (Opcional) | La variable del parámetro Entidades de entrenamiento de entrada que contiene los valores que se desean usar para entrenar el modelo. Este campo contiene valores (de entrenamiento) conocidos de la variable que se usará para predecir en ubicaciones desconocidas. | Field |
Tratar variable como variable de categorías (Opcional) | Especifica si el valor de Variable para predecir es una variable de categorías.
| Boolean |
Variables de entrenamiento explicativas (Opcional) | Una lista de campos que representan a las variables explicativas que ayudan a predecir el valor o la categoría del valor Variable para predecir. Active la casilla de verificación De categorías en el caso de las variables que representen clases o categorías (tales como cobertura de suelo, presencia o ausencia). | Value Table |
Entidades de distancia de entrenamiento explicativas (Opcional) | Las entidades de distancia de entrenamiento explicativas. Se crearán automáticamente variables explicativas mediante el cálculo de una distancia desde las entidades proporcionadas a los valores de Entidades de entrenamiento de entrada. Las distancias se calculan desde cada uno de los valores de Entidades de distancia de entrenamiento explicativas de entrada hasta el valor de Entidades de entrenamiento de entrada más cercano. Si los valores de Entidades de distancia de entrenamiento explicativas de entrada son polígonos o líneas, los atributos de distancia se calcularán como la distancia entre los segmentos más cercanos del par de entidades. | Feature Layer |
Rásteres de entrenamiento explicativos (Opcional) | Las variables explicativas de entrenamiento extraídas de los rásteres. Las variables de entrenamiento explicativas se crearán automáticamente extrayendo valores de celda ráster. Para cada entidad del parámetro Entidades de entrenamiento de entrada, el valor de la celda ráster se extrae de esa ubicación exacta. Se usa remuestreo de ráster bilineal al extraer el valor de ráster en el caso de los rásteres continuos. La asignación de vecino más cercano se usa al extraer un valor de ráster desde rásteres de categorías. Active la casilla de verificación De categorías en el caso de los rásteres que representen clases o categorías tales como cobertura de suelo, presencia o ausencia. | Value Table |
Entidades de predicción de entrada (Opcional) | Una clase de entidad que representa las ubicaciones en las que se realizarán predicciones. Esta clase de entidad también debe contener las variables explicativas proporcionadas como campos que se correspondan con las utilizadas de los datos de entrenamiento. | Feature Layer |
Entidades predichas de salida (Opcional) | La clase de entidad de salida que contiene los resultados de predicción. | Feature Class |
Superficie de predicción de salida (Opcional) | El ráster de salida que contiene los resultados de predicción. El tamaño de celda predeterminado será el tamaño de celda máximo de las entradas ráster. Para definir otro tamaño de celda, utilice la configuración de entorno Tamaño de celda. | Raster Dataset |
Variables explicativas coincidentes (Opcional) | Una lista de los valores de Variables explicativas especificados del parámetro Entidades de entrenamiento de entrada de la derecha y sus campos correspondientes del parámetro Entidades de predicción de entrada de la izquierda. | Value Table |
Entidades de distancia coincidentes (Opcional) | Una lista de los valores de Entidades de distancia explicativas especificados para el parámetro Entidades de entrenamiento de entrada de la derecha y sus conjuntos de entidades correspondientes del parámetro Entidades de predicción de entrada de la izquierda. Puede proporcionar valores de Entidades de predicción de entrada más adecuados para el parámetro Entidades de distancia explicativas si aquellos que se utilizan para el entrenamiento se encuentran en un área de estudio o periodo de tiempo distintos. | Value Table |
Rásteres explicativos coincidentes (Opcional) | Una lista de los valores de Rásteres explicativos especificados para el parámetro Entidades de entrenamiento de entrada de la derecha y sus rásteres correspondientes del parámetro Entidades de predicción de entrada o el parámetro Superficie de predicción que se crearán a la izquierda. Puede proporcionar valores de Rásteres explicativos más adecuados para el parámetro Entidades de predicción de entrada si aquellos que se utilizan para el entrenamiento se encuentran en un área de estudio o periodo de tiempo distintos. | Value Table |
Entidades de entrenamiento de salida (Opcional) | Las variables explicativas utilizadas para el entrenamiento (incluidos los valores de ráster y los cálculos de distancia muestreados), así como el campo Variable para predecir observado y las predicciones de acompañamiento que se utilizarán para evaluar en mayor profundidad el rendimiento del modelo entrenado. | Feature Class |
Tabla de importancia variable de salida (Opcional) | La tabla que contendrá información que describe la importancia de cada variable explicativa (campos, entidades de distancia y rásteres) utilizada en el modelo creado. Se puede acceder al gráfico creado a partir de esta tabla desde el panel Contenido. | Table |
Convertir polígonos a resolución ráster para entrenamiento (Opcional) | Especifica la forma de tratar a los polígonos al entrenar el modelo si los valores de Entidades de entrenamiento de entrada son polígonos con un valor de categorías para Variable para predecir y si solo se han especificado valores de Rásteres de entrenamiento explicativos.
| Boolean |
Número de árboles (Opcional) | La cantidad de árboles que se crearán en el modelo de bosque. Un mayor número de árboles por lo general dará lugar a una predicción de modelo más precisa, pero el modelo tardará más en calcularse. El número predeterminado de árboles es de 100. | Long |
Tamaño mínimo de hoja (Opcional) | El número mínimo de observaciones requeridas para conservar una hoja (es decir, el nodo terminal de un árbol que no tiene más divisiones). El mínimo predeterminado para regresión es 5 y el mínimo predeterminado para clasificación es 1. En el caso de datos muy grandes, si aumenta estos números se reducirá el tiempo de ejecución de la herramienta. | Long |
Profundidad máxima de árbol (Opcional) | El número máximo de divisiones que se realizarán en un árbol. Si se utiliza una profundidad máxima grande, se podrán crear más divisiones, lo cual puede aumentar las probabilidades de exceso de ajuste en el modelo. El valor predeterminado se basa en datos y depende del número de árboles creados y el número de variables incluidas. | Long |
Datos disponibles por árbol (%) (Opcional) | El porcentaje de valores de Entidades de entrenamiento de entrada que se utilizarán para cada árbol de decisión. El valor predeterminado es del 100 por cien de los datos. Las muestras de cada árbol se toman aleatoriamente a partir de dos tercios de los datos especificados. Cada árbol de decisión del bosque se crea con una muestra o un subconjunto aleatorios (aproximadamente dos tercios) de los datos de entrenamiento disponibles. Si utiliza un porcentaje menor de los datos de entrada para cada árbol de decisión, se aumenta la velocidad de la herramienta si los datasets son muy grandes. | Long |
Número de variables muestreadas aleatoriamente (Opcional) | El número de variables explicativas que se utilizarán para crear cada árbol de decisión. Cada árbol de decisión del bosque se crea con un subconjunto aleatorio de las variables explicativas especificadas. Al aumentar el número de variables utilizadas en cada árbol de decisión, aumentarán también las probabilidades de exceso de ajuste en el modelo, especialmente si existen una o varias variables dominantes. Una práctica habitual consiste en utilizar la raíz cuadrada del número total de variables explicativas (suma de campos, distancias y rásteres) si el valor de Variable para predecir es de categorías, o bien en dividir el número total de variables explicativas (suma de campos, distancias y rásteres) entre 3 si el valor de Variable para predecir es numérico. | Long |
Datos de entrenamiento excluidos para la validación (%) (Opcional) | El porcentaje (entre el 10 y el 50 por ciento) de los valores de Entidades de entrenamiento de entrada que se reservarán como el dataset de prueba para la validación. El modelo se entrenará sin este subconjunto aleatorio de datos, y los valores observados para esas entidades se compararán con los valores predichos. El valor predeterminado es del 10 por ciento. | Double |
Tabla de rendimiento de clasificación de salida (matriz de confusión) (Opcional) | Una matriz de confusión para la clasificación que resume el rendimiento del modelo creado. Esta tabla se puede usar para calcular otros diagnósticos además de las mediciones de precisión y sensibilidad que calcula la herramienta en los mensajes de salida. | Table |
Tabla de validación de salida (Opcional) | Si el valor de Número de ciclos de validación especificado es mayor que 2, esta tabla crea un gráfico de la distribución de R2 para cada modelo. Esta distribución se puede usar para evaluar la estabilidad del modelo. | Table |
Compensar categorías dispersas (Opcional) | Especifica si cada categoría del dataset de entrenamiento, independientemente de su frecuencia, se representará en cada árbol.
| Boolean |
Número de ciclos de validación (Opcional) | El número de iteraciones de la herramienta. La distribución de R2 de cada ciclo se puede mostrar con el parámetro Tabla de validación de salida. Cuando está definido y se han generado predicciones, solo el modelo que produjo el valor R2 más alto se usará para las predicciones. | Long |
Calcular incertidumbre (Opcional) | Especifica si la incertidumbre de predicción se calculará al entrenar, predecir a entidades o predecir a ráster.
| Boolean |
Archivo de modelo entrenado de salida (Opcional) | Un archivo de modelo de salida que guardará el modelo entrenado, que se puede utilizar más tarde para la predicción. | File |
Salida derivada
Etiqueta | Explicación | Tipo de datos |
Capas ráster de incertidumbre de salida | Si el parámetro Calcular incertidumbre está activado, la herramienta calculará un intervalo de predicción del 90 por ciento sobre cada valor predicho del parámetro Variable para predecir. | Raster Layer |