logo

Enterprise Miner : Classes sous SEM

Je voudrais faire une régression logistique en utilisant des classes de mes variables quantitatives…
Pour cela je peux utiliser le noeud transform variables et calculer des classes selon les quartiles ou quelque chose du genre mais le problème c’est que j’aimerais faire une classe exclusivement = 0 … car pour les montants par exemple il y en beaucoup qui sont égaux à zéro. Donc je voudrais avoir ma 1ère classe seulement pour des valeurs nulles puis la 2ème par exemple pour des valeurs comprises entre zéro exclus et 12000 F…
Comment m’y prendre ?

Pour le problème de découpage en classes : voici une solution à la main, parce qu’on ne peut pas faire mieux sans passer par un macro-programme dans le noeud SAS Code pour le faire automatiquement :

  1. calculer les valeurs des quantiles. Les noter sur un bout de papier (c’est VRAIMENT une solution à la main !)
  2. dans Transform Variables, créer une nouvelle variable, dont la définition sera : 1+(VAR>0)+(VAR>12000)+(VAR>20000) par exemple. Remplacer VAR par le nom de la variable quali de départ, et 12000 et 20000 par les quantiles de la feuille de papier.

Les tests entre parenthèses renvoient des booléens : 0 pour faux, 1 pour vrai. SEM produit une variable qui vaut : 1 pour les valeurs nulles, 2 pour les valeurs entre 0 exclus et 12000 inclus, 3 pour les valeurs entre 12000 exclus et 20000 inclus, 4 pour les valeurs > 20000.