Séminaire Data Mining – Educasoft Formations – 18 juin 2001
Antoine-Eric Sammartino : aesammartino@e-laser.fr
- Identifier des logiques d’achat des internautes à travers les différentes boutiques
- Définir des actions personnalisées sur le Web
Les données : Back Office (1/2)
Les données : Web (2/2)
Les Indicateurs (1/2)
Données de détail : OUI, mais pas de Data Mining sur données brutes !
Passer du transactionnel au relationnel :
➥ Une ligne par client (indicateurs individuels)
Des indicateurs : OUI, mais des indicateurs métier !
Collecter et rapprocher les données (1/2)
Pas de Data Mining sans Data Management !
Recherche et sélection des données :
➥ Plusieurs tables,
➥ Plusieurs niveaux,
➥ Des clefs différentes.
Constitution d’une table d’analyse :
➥ Juxtaposition de tables,
➥ Empilement de tables,
➥ Dédoublonnages
Collecter et rapprocher les données (2/2)
Le Data Mart : Autant de bases d’analyse que de niveaux d’observation
Analyser et interpréter : La démarche (1/4)
Analyser et interpréter : Les techniques (2/4)
Analyser et interpréter : Associations (3/4)
Pas de Data Mining sans hypothèse !
Validation d’une démarche d’hypothèses marketing :
➥ Sélection de produits cible,
➥ Définition du niveau des produits d’appel (univers, familles, produits),
➥ Exclusion de règles commerciales.
Analyser et interpréter : Segmentation (4/4)
Pas de Data Mining sans point de vue !
Autant de segmentations que de points de vue :
➥ Selon le cycle de commandes,
➥ Selon la nature du panier (détention),
➥ Selon la construction du panier sur le WEB
Industrialiser le processus : Système d’Information Décisionnel (1/5)
De l’Espace Etudes à l’Espace Industrialisé (2/5)
Espace Industrialisé – Bibliothèque (3/5)
Bibliothèque de fonctionnalités :
- Programmes de mise à jour des modèles (règles d’appartenance, scores…),
- Masques de simulations (scénario économiques),
- Masques de restitutions (indicateurs),
- Extraction vers Outils Bureautique (Word, Excel…)
Espace Industrialisé – Data Mart (4/5)
Nécessité de construire un DataMart :
- Production :
• intégrer les données-sources,
• mettre à jour régulièrement les indicateurs,
• appliquer les modèles.
- Fourniture :
• alimenter le « front-office » en données-résultats de façon automatique.
Espace Industrialisé – Données résultats (5/5)
Données-résultats qui alimentent le « Front-Office » :
- Indicateurs métier,
- Scores (de potentiel, de vulnérabilité, d’appétence…),
- Segmentations (profils de comportements…)
Du Data Mining au Web Mining
Chacun sa définition :
- Analyse d’audience du site,
- Analyse (MACRO)comportementale des internautes,
- Data Mining appliqué à des données Web,
- Data Mining On Line sur le Web
Data Mining On Line sur le Web :
- Mise en place de balises Web,
- Collecte et traitement de l’information utile,
- Connexion entre Back-Office et Front-Office,
- Intégration de nouvelles approches statistiques