logo

[SAS_OPT] Optimiser vos programmes SAS

Optimiser vos programmes SAS

Ce stage  permet de choisir la meilleure approche de programmation lorsque vous devez faire face à des gros volumes de données et que se posent des problèmes de performance, de mémoire ou d’espace.

A l’issue de ce stage vous serez capables d’arbitrer  en faveur de la meilleure méthode de programmation.

Durée : 2 jours

Pré-requis :  Avoir une bonne pratique de la programmation SAS, minimum SAS_BASE et idéalement SAS_PLUS

1.   Efficacité : de quoi parle-t-on ?

  • Efficacité, lisibilité à quel coût ?
  • BENCHMARKS : Comparer les techniques de programmation  pour se faire une idée

2.   SAS aime les tables “grandes et minces”

  • Réduire l’espace occupé par des variables
  • Compresser les tables ? une bonne idée ?

3.   PROC DATASETS : l’outil du programmeur efficace

  • Afficher les caractéristiques d’une table sas
  • Créer des indexes simples ou multiples

4.    Les formats : un patrimoine précieux dans la culture SAS

  • Table de dimensions ( codes) : penser format
  • OTHER= pour repérer les mal codés

5.   Rappels (inutiles ?)  sur les best practices dans l’étape DATA

  • KEEP= en abuser
  • WHERE mieux que IF quand on a le choix

6.   SORT :  la grande question des tris

  • Éviter les tris inutiles : INDEX/ NOTSORTED / GROUPFORMAT / CLASS / SORTED BY
  • Les options SAS qui impactent le  tri

7.   Mémoire : comment contrôler la mémoire utilisée

  • PAGESIZE et Nombre de Buffers
  • L’instruction SASFILE

8.   Techniques de jointure : laquelle choisir

  • HASHAGE / Utiliser des ARRAYS /SQL / MERGE/ Formats ?
  • Impact des indexes

9.   Techniques de filtre: laquelle choisir

  • Requête SQL imbriquée
  • Liste de codes dans une macro variable ( SQL INTO )
  • Filtrer au moment d’un tri ( WHERE)

10.   Techniques pour agréger les données

  • SUMMARY ou MEANS : la fin d’un mythe
  • COMPTEURS dans une étape DATA ( avec FIRST. LAST. )
  • GROUP BY de SQL

Version PDF

  • Share

Comments are closed.