Fonctionnement de l’algorithme de classification et de régression ExtraTrees

ExtraTrees (extremely randomized trees) est une méthode de Machine Learning supervisée d’ensemble qui utilise des arbres de décision et est utilisée par l’outil Entraîner à l’aide d’AutoML. Reportez-vous à la section Algorithme de classification et de régression avec arbres de décision pour obtenir des informations sur le fonctionnement des arbres de décision. Cette méthode est similaire à la méthode RandomForest mais peut être plus rapide.

L’algorithme ExtraTrees, comme l’algorithme des forêts aléatoires, crée de nombreux arbres de décision, mais l’échantillonnage pour chaque arbre est aléatoire, sans remplacement. Cela crée un jeu de données pour chaque arbre avec des échantillons uniques. Un nombre spécifique d’entités, à partir de l’ensemble total d’entités, sont également sélectionnées de manière aléatoire pour chaque arbre. La caractéristique la plus importante et unique de l’algorithme ExtraTrees réside dans la sélection aléatoire d’une valeur de fractionnement pour une entité. Au lieu de calculer une valeur optimale localement avec l’indice de Gini ou l’entropie pour fractionner les données, l’algorithme sélectionne aléatoirement une valeur de fractionnement. Cela rend les arbres diversifiés et non corrélés.

Ressources supplémentaires

Geurts, Pierre, Damien Ernst et Louis Wehenkel. "Extremely randomized trees." Machine learning 63, no. 1 (2006): 3-42.

Quelle est la différence entre l’algorithme ExtraTrees et l’algorithme RandomForest ?

Rubriques connexes


Dans cette rubrique
  1. Ressources supplémentaires