logo

Arbre de décision : Paramétrage et lecture d’un arbre de décision

Quels sont les critères importants et /ou indispensables à régler pour pouvoir valider mon arbre de décision ?

La méthode choisie (parmi CHAID, CART et C4.5, selon le critère (chi-2, entropie ou information de Gini) choisi dans BASIC) n’a généralement pas vraiment d’influence sur le résultat. Ce qu’il faut regarder, c’est le taux de classement (onglet SUMMARY des sorties) et en particulier sa constance dans les 2 ou 3 jeux de données TRAIN/VALIDATION/TEST (==> robustesse) ; il faut garder à l’esprit qu’en général l’arbre de décision est un mauvais outil prédictif : il découvre bien des niches mais fait un scoring médiocre sur les individus moyens.