Cartographie avec R Formation thématique dédiée à la production de cartes avec des packages comme {tmap} utilisant les mêmes principes que {ggplot2}, sur des fonds géométriques ou sur des images. L’insertion de cartes interactives dans une page HTML via Rmarkdown et le package {leaflet} est également abordée. Durée : 2 jours Logiciels possibles : R Pré-requis : R_BASE, VISUAL 1. Principes de base Fonds géométriques (shp) et fonds images (raster) Principaux packages R pour la cartographie Choix de la représentation […]
Automatiser les scripts R Cette formation permet de paramétrer et réutiliser des scripts R de manière à automatiser les travaux routiniers et/ou répétitifs. Durée : 2 jours Logiciels possibles : R Pré-requis : pratique régulière de R (niveau R_BASE minimum, idéalement R_PLUS) 1. Paramétrage avec des vecteurs Utilisation d’un paramètre dans les syntaxes classiques et dans {dplyr} Paramétrer une valeur Paramétrer le nom d’un vecteur ou d’un objet lu Paramétrer le nom d’un objet créé 2. Utilisation de boucles Syntaxe générale des boucles […]
Migrer de SAS vers R Cette formation est spécialement conçue pour des utilisateurs réguliers de SAS voulant découvrir la logique de R et les différences qui les attendent dans ce nouvel outil. L’accent est mis sur les fonctionnalités courantes de SAS et les pistes pour reproduire ces traitements dans R. Durée : 2 ou 3 jours selon les attentes et le niveau du public Logiciels possibles : R Pré-requis : utilisation régulière de SAS (niveau SAS_BASE minimum) Existe en formation à distance 1. […]
Construire des rapports avec R Ce stage permet d’explorer les différents packages de restitution automatique avec R. Il permet de produire des documents Word ou PowerPoint avec le package {officer}, des classeurs Excel avec {opensxls} et {xltabr}, HTML, PDF et Word avec Rmarkdown. Durée : 2 jours Logiciels possibles : R 3.4 et + Pré-requis : R_GGPLOT 1. Reporting avec Rmarkdown Principes Textes Tableaux Graphiques En-tête YAML 2. Tableaux croisés Package {reshape2} Package {tables} Package {flextable} 3. Documents Word et PPT (package {officer}) […]
Produire des graphiques avec le package ggplot2 Ce stage vise d’application des principes du dataviz avec le package {ggplot2} : construction de graphiques pour l’exploration statistique et la publication. Durée : 2 jours Logiciels possibles : R Pré-requis : R_PLUS, VISUAL 1. Le package {ggplot2} Principes Exporter un graphique, sauvegarde et recyclage 2. La fonction ggplot et ses compléments Grammaire des graphiques, les composants d’un graphique Données Esthétique Géométrie Traitement statistique Coordonnées Légendes Axes Thème 3. Éclatement (facetting) Principe Éclatement
Construire des applications interactives avec le package shiny Ce stage permet de s’initier au développement de mini-applications d’entreprise avec le package {shiny} : interfaces homme/machine, calculs et restitution. Durée : 1 jour Logiciels possibles : R Pré-requis : R_PLUS 1. Principes de shiny Fonctionnement d’une application shiny Transmission d’informations Réactivité 2. Fonctions pour les calculs Scripts server.R et global.R Fonction shinyServer Fonction reactive Fonction validate Fonction isolate Fonction observe Mise à jour d’objets input 3. Fonctions pour l’interface Fonction de mise en page […]
Aller plus loin avec R Ce stage permet de se perfectionner autour des fonctionnalités de packages du tidyverse ({dplyr}, {tidyr}, {forcats}, {purrr}), de la création de fonctions personnalisées et du reporting. Durée : 2 jours Logiciels possibles : R Pré-requis : R_BASE 1. Le package {dplyr} Principe de {dplyr} Sélections Création de variables Combinaison de tables Tris et doublons Statistiques descriptives 2. Automatisation Paramétrage Boucles Fonctions-boucles Le package {purrr} Création de fonction 3. Tableaux statistiques Tableaux statistiques avec {flextable} Tableaux statistiques avec […]
Machine learning avec R Ce stage apprend à construire des scores et des modèles statistiques prédictifs avec R : statistique exploratoire supervisée, régression logistique, arbres de décision, comparaison de modèles. Durée : 3 jours Logiciels possibles : R Pré-requis : R_BASE, STAT101 1. Gestion des données Imputation Équilibrage Bases d’apprentissage, de validation et de test 2. Statistiques descriptives Graphiques Mesures de liaison Découpage en tranches 3. Modélisation Régression logistique Arbre de décision Analyse discriminante SVM Forêts aléatoires Réseaux de neurones (PMC) 4. Comparaison […]
Typologie pour la segmentation client Ce stage est destiné aux chargés d’étude marketing qui ont besoin de bâtir des groupes homogènes de clients. Les techniques abordées sont la classification hiérarchique, les K-moyennes et la segmentation par arbre. Durée : 2 jours Logiciels possibles : SAS, R Pré-requis : STAT101 1. Analyse factorielle Analyse exploratoire Création de facteurs synthétiques Influence du codage sur le résultat Sélection du nombre optimal de facteurs 2. Segmentation Classification Ascendante Hiérarchique, dendrogramme K-moyennes, CCC, formes fortes Méthode mixte / […]
Modélisation pour la tarification en assurance Ce stage est destiné aux chargés d’étude et actuaires qui ont à modéliser les sinistralités et coûts moyens en assurance non vie. Les applications se font sur des modèles composites (IARD) et de prime pure (santé). Durée : 2 jours Logiciels possibles : SAS, R Pré-requis : STAT101 1. Modèle Gamma pour le coût moyen Phase exploratoire : adéquation à la loi Phase exploratoire : lien log et variables quantitatives Construction et simplification du modèle Commentaire du modèle Cas […]
Introduction à la statistique bayésienne Ce stage décrit les principes et les applications en épidémiologie des mécanismes de statistique bayésienne et ses différences avec la statistique classique (fréquentiste). Des applications seront présentées en utilisant des logiciels libres (R et Winbugs). Durée : 1 ou 2 jours selon le degré de détails souhaité Logiciels possibles : R Pré-requis : STAT101 1. Introduction à l’approche bayésienne 2. Lois a priori, vraisemblance, lois a posteriori, formule de Bayes 3. L’analyse bayésienne 4. Initiation aux méthodes MCMC […]
Construire un score avec SAS Cette formation s’adresse aux chargés d’étude désirant avoir, en quelques jours, un aperçu technique et pratique des techniques usuelles de scoring sous SAS. Durée : 2 jours Logiciels possibles : SAS Pré-requis : aucun 1. Gestion des données Imputation Equilibrage Bases d’apprentissage, de validation et de test 2. Statistiques descriptives Graphiques Mesures de liaison Découpage en tranches 3. Modélisation Régression logistique Arbre de décision Analyse discriminante 4. Comparaison de modèles Indicateurs numériques Représentations graphiques Seuil optimal
Régression logistique Destiné aux chargés d’étude s’intéressant à la modélisation d’une variable binaire, ce stage permet de construire efficacement des modèles explicatifs et prédictifs (construction de scores). Durée : 2 jours Logiciels possibles : SAS, R Pré-requis : STAT101 1. Principe de la régression logistique Quelle est la forme des données à utiliser ? Lien avec la régression linéaire Les différentes fonctions de lien Mesurer la qualité d’un modèle logistique 2. La régression logistique à but descriptif Tests de type 3 Stratégies de […]
Modèles mixtes et hiérarchiques Cette formation permet de maîtriser des modèles qui généralisent l’analyse de variance, en particulier pour le traitement des données à mesures répétées. Un autre champ d’application est la construction de modèles hiérarchiques (ou multiniveaux) faisant intervenir des organisations emboîtées (en éducation : établissement, classe, élève). Durée : 2 jours Logiciels possibles : SAS, R Pré-requis : STAT101 1. Principes des modèles mixtes Effet fixe et effet aléatoire Données corrélées, répétées Différents types de modèles mixtes Méthodologie de construction des modèles […]
Modèle linéaire généralisé Les modèles présentés ici font de la régression linéaire et de la régression logistique des cas particuliers. Les Modèles Linéaires Généralisés (MLG) se proposent d’étudier les variables dont la normalité est prise en défaut (coûts, fréquences d’évènements, …) et proposent des outils puissants. Durée : 2 jours Logiciels possibles : SAS, R Pré-requis : STAT101 1. Principes de la régression Vocabulaire et concepts La régression linéaire La régression logistique Leurs points communs 2. Modèle linéaire généralisé Loi de Y Fonction […]
Analyse des données Ce stage est destiné aux chargés d’études qui désirent voir ou revoir les principes de l’analyse factorielle (ACM, ACP) et surtout leur utilisation à travers SAS/STAT ou R (package {FactoMineR}). On y aborde également la classification. Durée : 2 jours Logiciels possibles : SAS, R Pré-requis : STAT101 1. L’analyse en composantes principales (ACP) Choix du nombre d’axes factoriels Nuages des individus et des variables Cercle des corrélations Rotation VARIMAX et ACP 2. L’analyse des correspondances multiples (ACM) Choix du […]
Présenter clairement des données, construire des graphiques intelligents Ce stage est destiné à tous ceux qui ont besoin de résumer des jeux de données par des graphiques, qu’il s’agisse de présentations, de tableaux de bord ou de recherche exploratoire. Cette formation se concentre sur les différents types de graphiques et les moyens de leur donner une efficacité maximale. Elle pourra être couplée avec une formation aux graphiques SAS ou R. Cette formation peut être couplée avec STAT101 pour découvrir les […]
Initiation à R Le logiciel R est principalement conçu pour des utilisations statistiques. Il recèle cependant de très nombreuses fonctionnalités de gestion de fichiers. Cette formation peut être couplée avec STAT101, pour prolonger l’apprentissage avec la production de statistiques descriptives sous R. Durée : 2 jours Logiciels possibles : R Pré-requis : aucun 1. Présentation de R Télécharger le logiciel Packages Environnement de base R Studio R Commander 2. Principes du langage R Fonctions : principes, utilisation, personnalisation Types de données Structures de données […]
Initiation à la statistique Ce stage est destiné aux personnes désireuses de découvrir les principes et les applications de la statistique. Il couvre principalement la statistique descriptive à une ou deux variables (graphiques et tableaux) et se termine sur un élargissement aux techniques plus avancées (tests, prévisions). Ce cours est prévu sous forme appliquée ; seules les formules indispensables seront présentées. Durée : 2 jours Logiciels possibles : Excel, SAS, R Pré-requis : manipulations de base du logiciel d’application 1. […]