logo

Régression : Valider un modèle avec la proc LOGISTIC, préférer un modèle à un autre

Pour valider un modèle avec la V6 j’utilisais la proba correspondante au Khi 2 de la log vraisemblance. Avec la V8 le Khi 2 ne sort plus automatiquement, et je n’ai pas trouvé l’option pour le faire apparaître. Connaissez-vous cette option ?

Ou d’une manière plus générale, quels sont les critères qui nous permettent de valider un modèle ?

Lorsque l’on compare 2 modèles, et que les statistiques d’Akaike et de Schwartz ne sont pas plus petites pour le même modèle, peut-on utiliser un autre critère pour privilégier un des 2 modèles ?

 

Cette sortie existe toujours, mais elle a été séparée en 2 morceaux !

  1. Dans la partie Fit Statistics, on retrouve les critères d’Akaike, de Schwartz et la log-vraisemblance
  2. Dans la partie Global Tests, on a les tests du chi2 associés au score, à la log-vraisemblance et à la statistique de Wald

Pour valider le modèle, on s’assure effectivement en tout premier lieu que ces tests ont leur hypothèse rejetée (le modèle est porteur de sens). Puis on vérifie que 2 des 3 critères parmi la log-vraisemblance, Akaike et Schwarz sont moindres pour le modèle avec variable(s) que pour le modèle sans variable explicative (constante seule).

Pour départager deux modèles, on peut aussi analyser leur pouvoir discriminant. Il est mesuré par le « c » de la dernière sortie (Association Statistics) : c’est l’aire sous la courbe ROC, c’est à dire la mesure du compromis entre les erreurs « faux positifs » (observation avec la vraie valeur 0 prédite à 1) et « faux négatifs » (valeur 1 observée, prédiction 0).