Etiqueta | Explicación | Tipo de datos |
Tipo de predicción
| Especifica el modo de funcionamiento de la herramienta. La herramienta puede ejecutarse para entrenar un modelo solo para evaluar rendimientos, predecir entidades o crear una superficie de predicción.
| String |
Entidades de formación de entrada
| La clase de entidad que contiene el parámetro Variable para predecir y, opcionalmente, las variables explicativas de entrenamiento provenientes de los campos. | Feature Layer |
Variable para predecir
(Opcional) | La variable del parámetro Entidades de entrenamiento de entrada que contiene los valores que se desean usar para entrenar el modelo. Este campo contiene valores (de entrenamiento) conocidos de la variable que se usará para predecir en ubicaciones desconocidas. | Field |
Tratar variable como variable de categorías (Opcional) | Especifica si la Variable para predecir es una variable de categorías.
| Boolean |
Variables de entrenamiento explicativas
(Opcional) | Una lista de campos que representan a las variables explicativas que ayudan a predecir el valor o la categoría de la Variable para predecir. Active la casilla de verificación De categorías en el caso de las variables que representen clases o categorías (tales como cobertura de suelo, presencia o ausencia). | Value Table |
Entidades de distancia de entrenamiento explicativas
(Opcional) | Crea automáticamente variables explicativas mediante el cálculo de una distancia desde las entidades proporcionadas a las Entidades de entrenamiento de entrada. Las distancias se calculan desde cada una de las Entidades de distancia de entrenamiento explicativas de entrada hasta las Entidades de entrenamiento de entrada más cercanas. Si las Entidades de distancia de entrenamiento explicativas de entrada son polígonos o líneas, los atributos de distancia se calculan como la distancia entre los segmentos más cercanos del par de entidades. | Feature Layer |
Rásteres de entrenamiento explicativos (Opcional) | Crea automáticamente variables de entrenamiento explicativas en su modelo, extrayendo sus valores desde rásteres. Para cada entidad de las Entidades de entrenamiento de entrada, el valor de la celda ráster se extrae de esa ubicación exacta. Se usa remuestreo de ráster bilineal al extraer el valor de ráster en el caso de los rásteres continuos. La asignación de vecino más cercano se usa al extraer un valor de ráster desde rásteres de categorías. Active la casilla de verificación De categorías en el caso de los rásteres que representen clases o categorías tales como cobertura de suelo, presencia o ausencia. | Value Table |
Entidades de predicción de entrada (Opcional) | Una clase de entidad que representa las ubicaciones en las que se realizarán predicciones. Esta clase de entidad también debe contener las variables explicativas proporcionadas como campos que se correspondan con las utilizadas de los datos de entrenamiento, si las hubiera. | Feature Layer |
Entidades predichas de salida
(Opcional) | La clase de entidad de salida que recibirá los resultados de predicción. | Feature Class |
Superficie de predicción de salida (Opcional) | El ráster de salida que contiene los resultados de predicción. El tamaño de celda predeterminado será el tamaño de celda máximo de las entradas ráster. Para definir otro tamaño de celda, utilice la configuración de entorno de tamaño de celda. | Raster Dataset |
Variables explicativas coincidentes
(Opcional) | Una lista de las Variables explicativas especificadas de las Entidades de entrenamiento de entrada de la derecha y sus campos correspondientes de las Entidades de predicción de entrada de la izquierda. | Value Table |
Entidades de distancia coincidentes
(Opcional) | Una lista de las Entidades de distancia explicativas especificadas para las Entidades de entrenamiento de entrada de la derecha. Los conjuntos de entidades correspondientes deberían especificarse en las Entidades de predicción de entrada de la izquierda. Puede proporcionar Entidades de predicción de entrada más adecuadas para las Entidades de distancia explicativas si aquellas que se utilizan para el entrenamiento se encuentran en un área de estudio o periodo de tiempo distintos. | Value Table |
Rásteres explicativos coincidentes
(Opcional) | Una lista de los Rásteres explicativos especificados para las Entidades de entrenamiento de entrada de la derecha. Los rásteres correspondientes deberían especificarse en las Entidades de predicción de entrada o la Superficie de predicción que se creará en la izquierda. Puede proporcionar Rásteres explicativos más adecuados para las Entidades de predicción de entrada si aquellas que se utilizan para el entrenamiento se encuentran en un área de estudio o periodo de tiempo distintos. | Value Table |
Entidades de entrenamiento de salida
(Opcional) | Las Entidades de entrenamiento de salida contendrán todas las variables explicativas utilizadas para el entrenamiento (incluidos los valores de ráster y los cálculos de distancia muestreados), así como el campo Variable para predecir observado y las predicciones de acompañamiento que se pueden utilizar para evaluar en mayor profundidad el rendimiento del modelo entrenado. | Feature Class |
Tabla de importancia variable de salida
(Opcional) | Si se especifica, la tabla contendrá información que describe la importancia de cada variable explicativa (campos, entidades de distancia y rásteres) utilizada en el modelo creado. Se puede acceder al gráfico creado a partir de esta tabla desde el panel Contenido. | Table |
Convertir polígonos a resolución ráster para entrenamiento
(Opcional) | Especifica la forma de tratar a los polígonos al entrenar el modelo si las Entidades de entrenamiento de entrada son polígonos con una Variable para predecir de categorías y si solo se han especificado Rásteres de entrenamiento explicativos.
| Boolean |
Número de árboles
(Opcional) | La cantidad de árboles que se crearán en el modelo de bosque. Un mayor número de árboles por lo general dará lugar a una predicción de modelo más precisa, pero el modelo tardará más en calcularse. El número predeterminado de árboles es de 100. | Long |
Tamaño mínimo de hoja
(Opcional) | El número mínimo de observaciones requeridas para conservar una hoja (es decir, el nodo terminal de un árbol que no tiene más divisiones). El mínimo predeterminado para regresión es 5 y el mínimo predeterminado para clasificación es 1. En el caso de datos muy grandes, si aumenta estos números se reducirá el tiempo de ejecución de la herramienta. | Long |
Profundidad máxima de árbol
(Opcional) | El número máximo de divisiones que se realizarán en un árbol. Si se utiliza una profundidad máxima grande, se podrán crear más divisiones, lo cual puede aumentar las probabilidades de exceso de ajuste en el modelo. El valor predeterminado se basa en datos y depende del número de árboles creados y el número de variables incluidas. | Long |
Datos disponibles por árbol (%)
(Opcional) | Especifica el porcentaje de las Entidades de entrenamiento de entrada utilizadas para cada árbol de decisión. El valor predeterminado es del 100 por cien de los datos. Las muestras de cada árbol se toman aleatoriamente a partir de dos tercios de los datos especificados. Cada árbol de decisión del bosque se crea con una muestra o un subconjunto aleatorios (aproximadamente dos tercios) de los datos de entrenamiento disponibles. Si utiliza un porcentaje menor de los datos de entrada para cada árbol de decisión, se aumenta la velocidad de la herramienta si los datasets son muy grandes. | Long |
Número de variables muestreadas aleatoriamente
(Opcional) | Especifica el número de variables explicativas utilizadas para crear cada árbol de decisión. Cada árbol de decisión del bosque se crea con un subconjunto aleatorio de las variables explicativas especificadas. Al aumentar el número de variables utilizadas en cada árbol de decisión, aumentarán también las probabilidades de exceso de ajuste en el modelo, especialmente si existen una o varias variables dominantes. Una práctica habitual consiste en utilizar la raíz cuadrada del número total de variables explicativas (suma de campos, distancias y rásteres) si su Variable para predecir es numérica, o bien en dividir el número total de variables explicativas (suma de campos, distancias y rásteres) entre 3 si la Variable para predecir es de categorías. | Long |
Datos de entrenamiento excluidos para la validación (%) (Opcional) | Especifica el porcentaje (entre el 10 y el 50 por ciento) de las Entidades de entrenamiento de entrada que se deben reservar como el dataset de prueba para la validación. El modelo se entrenará sin este subconjunto aleatorio de datos, y los valores observados para esas entidades se compararán con los valores predichos. El valor predeterminado es del 10 por ciento. | Double |
Tabla de rendimiento de clasificación de salida (matriz de confusión) (Opcional) | Si se especifica, crea una matriz de confusión para la clasificación que resume el rendimiento del modelo creado. Esta tabla se puede usar para calcular otros diagnósticos más allá de las mediciones de precisión y sensibilidad que calcula la herramienta en los mensajes de salida. | Table |
Tabla de validación de salida (Opcional) | Si el Número de ciclos de validación especificado es mayor que 2, esta tabla crea un gráfico de la distribución de R2 para cada modelo. Esta distribución se puede usar para evaluar la estabilidad de su modelo. | Table |
Compensar categorías dispersas
(Opcional) | Si hay categorías en el dataset que no se producen con la frecuencia de otras, al activar este parámetro garantizará que todas las categorías se representen en cada árbol.
| Boolean |
Número de ciclos de validación
(Opcional) | La herramienta se ejecutará durante el número de iteraciones especificado. La distribución de R2 de cada ciclo se puede mostrar con el parámetro Tabla de validación de salida. Cuando está definido y se han generado predicciones, solo el modelo que produjo el valor R2 más alto se usará para las predicciones. | Long |
Calcular incertidumbre
(Opcional) | Especifica si la incertidumbre de predicción se calculará al entrenar, predecir a entidades o predecir a ráster.
| Boolean |
Salida derivada
Etiqueta | Explicación | Tipo de datos |
Capas ráster de incertidumbre de salida | Si se activa Calcular incertidumbre, la herramienta calculará un intervalo de predicción del 90 por ciento sobre cada valor predicho de la Variable para predecir. | Capa ráster |