logo

Analyse de données : Classification sur tableau disjonctif complet

Bonjour.

Je veux faire une classification sur les individus d’un tableau disjonctif complet. Pouvez-vous me donner le code sous SAS ?
D’avance merci.

Bonjour.

Comme votre point de départ est un tableau disjonctif complet, il est préférable de faire une ACM (PROC CORRESP) au préalable. On récupère les coordonnées factorielles des observations dans la table créée par l’option OUTC de la PROC CORRESP (filtrer uniquement les lignes où _TYPE_= »OBS »).
La procédure CLUSTER construit ensuite une CAH sur les coordonnées factorielles :

PROC CLUSTER DATA = tableSAS
      OUTTREE = tableDendogramme ;
   VAR dim: ;
RUN ;

La table créée par l’option OUTTREE contient les informations nécessaires au dessin du graphique de fusion des classes (dendogramme ou graphique arborescent). On obtient ce dernier par la procédure TREE :

PROC TREE DATA = tableDendogramme ;
RUN ;

Une fois choisi le bon nombre de classes, vous exécutez une dernière fois la procédure TREE pour obtenir l’affectation des individus aux classes :

PROC TREE DATA = tableDendogramme
      OUT = tableClassement
      NCLUSTERS = nbClasses ;
RUN ;