logo

Arbre de décision : EM – Problème de variables numériques discrètes lors de modélisation

Bonjour, Suite à une modélisation sous SAS EM (via une régression logistique et arbre de décision), je voudrais « forcer » le type de quelques variables. Celles-ci présentent des valeurs numériques discrètes (par exemple, un nombre de contrats : 0,1,2 ou 3) et lors de la phase de modélisation, EM fait des moyennes de ces chiffres car dans le noeud IDS, elles sont en « interval ». Pourtant, pour un client, cela ne veut rien dire d’avoir moins de 0,5 contrat. Les quatre mesures proposées telles BINARY, INTERVAL, NOMINAL ou ORDINAL ne répondent pas au problème de conserver des valeurs entières alors comment puis-je le résoudre ? Merci de votre aide.

 

Pour votre question de variables discrètes comme un nombre de contrats, il devrait suffire de déclarer sa mesure comme ORDINAL dans le nœud INPUT DATA SOURCE ou, si vous voulez limiter ce changement à certaines branches de votre diagramme, avec un nœud DATA SET ATTRIBUTES.