Árboles extra ("extra" proviene del inglés "extremely randomized") es un método de aprendizaje automático supervisado de ensamblaje que utiliza árboles de decisión y se utiliza en la herramienta Entrenar con AutoML. Consulte Algoritmo de clasificación y regresión de árboles de decisión para obtener información sobre cómo funcionan los árboles de decisión. Este método es similar a los bosques aleatorios, pero puede ser más rápido.
Al igual que el algoritmo de bosques aleatorios, el algoritmo Árboles extra crea numerosos árboles de decisión, pero el muestreo de cada árbol es aleatorio, sin sustitución. Con ello se crea un dataset para cada árbol con muestras únicas. También se selecciona de forma aleatoria para cada árbol un número específico de entidades del conjunto total de entidades. La característica más importante y única de Árboles extra es la selección aleatoria de un valor de división de una entidad. En lugar de calcular un valor óptimo localmente con Gini o entropía para dividir los datos, el algoritmo selecciona aleatoriamente un valor de división. Esto hace que los árboles se diversifiquen y no estén correlacionados.
Recursos adicionales
Geurts, Pierre, Damien Ernst y Louis Wehenkel. "Extremely randomized trees". Machine learning 63, no. 1 (2006): 3-42.
¿Cuál es la diferencia entre Árboles extra y Bosque aleatorio?