logo

Régression : modélisation d’un prix

Je dois modéliser un prix. J’ai utlisé jusqu’à présent la PROC REG mais je ne sais pas comment intégrer les variables qualitatives (certaines ont un gand nombre de modalités: par exemple 15).

 

La procédure REG ne permet pas d’inclure des variables qualitatives dans le modèle. Il faut utiliser alors la proc GLM qui fonctionne de manière assez semblable.

PROC GLM DATA = tableSAS ;
    CLASS listeVariablesQuali ;
    MODEL variableY = listeVariablesQuantiEtQuali / ESTIMATE ;
    LSMEANS variableQuali / PDIFF=ALL ;
 RUN ; QUIT ;

Une remarque : si le nombre d’observations sur lesquelles vous modélisez est faible, trop de modalités à vos variables qualitatives risquent de faire baisser la robustesse de votre modèle, et alors sans doute faudra-t-il fusionner des modalités… Dans ce cas, les comparaisons 2 à 2 de modalités peuvent vous aider (instruction LSMEANS ci-dessus).

Une seconde remarque : si la distribution de vos prix à modéliser suit une loi normale, les procédures REG et GLM sont effectivement appropriées. S’ils suivent plutôt une loi Gamma, il faudra passer à la procédure GENMOD.