logo

Représentation visuelle

La procédure SGPLOT, sa vie, son œuvre

A partir de SAS 9.2, la procédure SGPLOT (et ses sœurs SGPANEL et SGSCATTER) vient proposer une autre manière de créer des graphiques depuis SAS. Cette présentation ne suppose aucune connaissance du fonctionnement « historique » de SAS/GRAPH. Quelqu’un qui n’a jamais utilisé une procédure GPLOT ou GCHART peut tout à fait comprendre la logique de SGPLOT, aussi bien qu’un familier de ces procédures (qui sera peut-être même dérouté par sa simplicité). En SAS 9.3, les procédures SG… sont directement rattachées au […]

Le DataViz

Une définition Le DataViz (abrégé de Data Visualization, visualisation de données) est un terme récent qui désigne aussi bien la production de graphiques pour représenter des informations que les règles permettant que ces graphiques soient efficaces. Un équivalent français de ce terme pourrait être la sémiologie graphique, pour reprendre un terme utilisé par Jacques Bertin dans les années 1960-70. Un autre, plus courant, serait l’infographie, même si ce terme désigne plus souvent le résultat (le graphique lui-même) que les conditions […]

La proc GREPLAY expliquée à ma fille

La procédure GREPLAY permet d’associer plusieurs graphiques en un seul, en jouant sur leurs emplacements et leur distribution. Elle utilise des mises en forme prédéfinies, les templates. Voici une petite introduction à son fonctionnement. Étape n° 1 : générer des graphiques et les sauvegarder Les graphiques SAS sont stockés dans des catalogues, sous formes d’entrées de type GRSEG. Pour choisir le nom et l’emplacement de ces sauvegardes, il faut ajouter aux procédures graphiques deux options : GOUT qui est le nom du […]

La proc GCHART expliquée à ma fille

Produire des diagrammes en bâtons ne semble pas une tâche ardue. Les options disponibles dans la procédure GCHART de SAS ne sont d’ailleurs pas si nombreuses. Mais pour obtenir quelques graphiques complexes, il vaut souvent mieux réfléchir à l’organisation de la table SAS en entrée, que chercher une option qui n’existe peut-être pas. Quelques exemples pour illustrer cette manière de penser (pour agrandir les images, cliquer dessus). La syntaxe de base : bâtons, groupes et sous-groupes La procédure GCHART définit 4 […]

Les formats expliqués à ma fille

Pour certains, le format, ce n’est qu’une cochonnerie qui complique passablement le travail sur les dates, ou sur les nombres, en n’affichant pas les données telles qu’elles sont stockées. On sait moins que, dans SAS, les formats sont également un formidable outil de recodage de variables. Quel est le rôle du format ? Le format est un moyen de présenter (à l’affichage principalement) les données différemment de la façon dont elles sont physiquement stockées. L’exemple le plus frappant est celui des […]

La procédure GPLOT expliquée à ma fille

La production de graphiques depuis SAS a mauvaise presse. Pourtant sa syntaxe n’est pas si compliquée qu’on le dit, et son rendu graphique est largement acceptable, surtout si on ne joue pas au jeu des 10 erreurs avec un graphique sous Excel.   Le cœur de chauffe : la procédure elle-même   PROC GPLOT DATA = tableLue ; PLOT variableAxeVertical * variableAxeHorizontal ; RUN ; QUIT ; A la lecture de cette syntaxe : deux questions viennent souvent à l’esprit. […]

Les tables Annotate expliquées à ma fille

Pour améliorer un graphique SAS, il n’est forcément payant de passer des heures à éplucher la documentation pour trouver une option magique. Il est souvent plus simple de donner à SAS des instructions de dessin pour qu’il surcharge la version « brute » du graphique. Ces instructions de dessin sont consignées dans une table appelée Annotate ; pour faire des merveilles, il suffit généralement d’une étape Data et d’un peu d’organisation. Comment se présente une table Annotate ? Il s’agit […]

Représenter graphiquement la répartition d’un score

Intérêt Une régression logistique, ou d’autres modèles décisionnels comme les réseaux de neurones, les arbres de décision, les analyses discriminantes, etc., produisent des scores. Ceux-ci sont transformables, selon le problème, en décisions. Si ça doit être le cas, quel seuil doit-on choisir ? Est-ce qu’un score coupé à 0,5 est toujours le meilleur choix ? Le graphique présenté ici permet d’affiner le choix du seuil de score. Il utilise la procédure KDE, nouveauté de SAS/STAT en version 8. Type de […]