Datamining appliqué au churn client dans les télécommunications
1. Pour l’obtention du diplôme d’Ingénieur d’Etat en Informatique
Option : Systèmes d’Information
Thème : Datamining appliqué
au churn client dans les
télécommunications
Binôme:
KHELOUFI Tarik
TALEB Abdelmoumène
3 Juillet 2011
2. Le phénomène du churn
Datamining
Concepts et notions Modèle de prédiction
Méthodologie
Présentation de Un Telco
Un Telco face au churn Le Churn chez Un Telco
Insuffisances constatés
Objectifs du Projet
Structure et architecture
Notre solution face au churn Processus de Gestion de churn
Notre Solution
Récapitulatifs
Apports Conclusions et Perspectives
Contraintes
Perspectives
3. “The Customer is King ”
+92%
De taux de pénétration du
Marché des Télécommunications
Saturation =
Clients libres
Source : ARPT autorité de régulation des postes et des télécommunications
5. 1. Le churn
Concepts et notions 2. Datamining
3. Modèle de prédiction
4. Méthodologie
“If we don’t take care of our customers, someone else will.”
Mike Kesoh
6. Churn : Contraction de l'anglais « change and turn »
Définition
Churn : (Du français [Attrition] )
Exprime le taux de déperdition de clients
pour une entreprise
7. Domaines d’apparition du Churn
Télécommunication
Télécommunication Fournisseur d’accès internet
Banque Assurance
8. Datamining
Ou fouille de données
« extraction d'un savoir ou d'une connaissance à
partir de grandes quantités de données »
Description Estimation Segmentation
Classification La prévision
Prévision Association
12. Modèles de prédiction
Arbre de décision
Un arbre de décision est un outil d'aide à la décision qui représente la
situation plus ou moins complexe à laquelle on doit faire face sous la
forme graphique d'un arbre de façon à faire apparaître l'extrémité de
chaque branche les différents résultats possibles en fonction des
décisions prises à chaque étape :
13. Modèles de prédiction
Réseaux de neurones
Les réseaux connexionnistes appelés aussi les réseaux de neurones
artificiels occupent une place centrale parmi les outils de prédiction.
Le neurone artificiel (neurone informatique) est un petit model
statistique a lui tout seule. Il doit accomplir 2 tâches :
la synthèse des la transformation (souvent non
informations qui linéaire) de cette information en
lui sont fournies quelque chose de nouveau
14. Modèles de prédiction
SVM : Support Vector Machine
Le SVM repose sur deux idées
la notion de la notion de
marge maximale fonction noyau
15. Outils de Datamining : Test du SVM
capacité documentati modélisatio Performanc Références
de on n e/
données Ressource
Bon Faible Meilleur
16. Méthodologie : CRISP-DM
1 Compréhension métier
2 Compréhension des données
3 Préparation des données
4 Modélisation
5 Evaluation
FIN : Déploiement
CRoss-Industry Standard Process for Data Mining
17. « ..today, “churn management” has become one
of the most critical business issues »
Rob Matisson
1. Présentation de Un Telco
2. Un Telco face au churn
Le Churn chez Un Telco
3. Insuffisances constatés
4. Objectifs du Projet
18. Un Telco : en chiffres
opérateur en Algérie
+ de 8 millions d’abonnés
+ de 90% de la population couverte
+ 200 Espaces De Services
Près de 1600 employés
Meilleur opérateur mobile 2007 en Afrique du Nord
19. Un Telco dans le marché Algérien
Nedjma
19%
Mobilis
28%
Djezzy
53%
20. Un Telco : Organigramme
DIRECTION
GENERALE
Direction Ressource Direction
Direction
Humaine Technologie
Technologie
Direction Service
Direction Vente et
Client
Distribution
Direction Finance Direction Solution
Entreprise
Direction Marketing Direction Stratégie
21. Un Telco Face au churn
Churn
DataWare
Marketing CRM
house
Etude de satisfaction Réception des plaintes archivage des données
Régulier Insatisfait Churner
23. Le Churn : une opportunité
Mieux réagir que le + Parts de marché Acquérir de Bon
concurrent et meilleure image clients
Quand le churn survient, le
Ex : Perdre tout les mauvais
( Perdre est apte a acquérir et de
client moins de clients ( les
payeurs et/ou reconsidérer
CApayeurs et concurrents
) que les concurrents
bons ses choixdesaprioris
)
24. Objectifs du Projet
Calculer le taux de churn
Prédire le phénomène Churn
Trouver les raisons du Churn
Surmonter le problème de Coordination
25. « the future is a projection of present »
Aldous Huxley
1. Structure et architecture
Notre solution face au churn 2. Gestion de churn
3. Notre Solution
27. Solution face au churn
Outils de prédiction :
Datamining
Tableau de bord
Décisionnel
Informatique
28. Solution face au churn
Priorité Difficulté
Outils
Règles
Organisationnelle Processus
Structure
Mesures
Appliqué moyenne maximale
29. Architecture de la solution
Enquête
Marketing
Modèle Vue
DataWarehouse DataMining
DataMart
Utilisateur
BDD CRM
30. Pleinte Processus de la solution
Model Prédiction de churn
Données
CRM
Appel Risque de
chrun
Données
Réduction de churn
DataWarehouse
Campagne de
rétentions
Décision
34. « A conclusion is simply the place where
someone got tired of thinking. »
Herbert Albert Fisher
1. Récapitulatif
2. Apports
Conclusions et Perspectives
3. Contraintes
4. Perspectives
36. Récapitulatif
1 2 3 des 4 5
Compréhension Compréhension Préparation
Modélisation Evaluation
métier des données données
37. Récapitulatif
6 7
Réalisation Liste des Livrables
Logiciel Benchmarking
Organisationnelle Guide
38. Conclusion &Perspectives
Apports :
Pro-activité face au churn (prédiction)
Compréhension des Raisons du churn chez
Sensibilisation
Benchmarking
Guide pour la Gestion du Churn chez
39. Conclusion &Perspectives
Contraintes :
Dispersion des données nécessaires
Manque de Coopération
Effort de longue durée dans le temps
La taux de pénétration du marché des télécom est élevé , le marché est proche de la saturation. quand le marché est saturé il n’y a plus de clients libres dans la nature , il sont tous chez les concurrents c’est pour ça qu’il faut …. (voir slide suivant)
…. Se concentrer sur ces clients ! .... Avant que ce dernier ne vous quitte !!!Mais malgrés la saturation ce qui peut encore arriver est qu’un client vous quitteLe « churn » est la concept principale de notre projet , nous allons vous l’expliquer en details
Le churn en quelques mots c’est : …
Le phénomène de churn apparait dans les secteurs ou la notion de consommation régulière existe
Définition du DM et ses taches
Prcessus du DataMining
DataMining et une branche la BI
3 principaux Model de prédiction NON-Supervisé : Parler de l’apprentissage !!!!!!!!!!!!!!!!!!!!!!
1963 Première utilisation de l’arbre de décision dans un processus de prédiction et d’éxplication (AID – Automatic Interaction Detection). parMorgan et Sonquist1984 travaux de premier algorithme de CART(méthode permettant d'inférer des arbres de décision binaires)Breiman & al
1949 Création de la "règle de Hebb" parDonald Hebb1957 Création du modèle du perceptron par Franck Rosenblatt1969 Demonstration des limitations théoriques du Perceptron, et plus généralement des classifieurs linéaires par Marvin Lee Minsky et Seymour Papert1986 Perceptron Multi-Couche par Rumelhart
Les machines à support de vecteurs (de l’anglais Support Vector Machine)Hyperplan séparateur et marge maximale: fonction discriminante séparant deux classes, dans notre cas la classe des clients churnés et la classe des clients non churnés. La marge est la distance entre la frontière de séparation et les échantillons les plus proches. transformer l'espace de représentation des données d'entrées en un espace de plus grande dimension (possiblement de dimension infinie), dans lequel il est probable qu'il existe une séparatrice linéaire. Ceci est réalisé grâce à une fonction noyau, qui doit respecter certaines conditions, et qui a l'avantage de ne pas nécessiter la connaissance explicite de la transformation à appliquer pour le changement d'espace.
Outil de DM pour le SVM
1 Compréhension métier : nous avons effectué un benchmarking (cas d'étude étrangers)2 Compréhension des données : nous avons évaluer les données disponible au sein de 3 Préparation des données : nous avons structurer les données sous forme exploitable4 Modélisation : nous avons créer notre modèle de prédiction 5 Evaluation : nous avons évaluer les résultats obtenus en comptant le taux de bonne prédiction du modèle FIN Déploiement Données
Pas de communication entre les 3 services concernés
Résultat de notre étude de l’existant, il y a deux principaux problèmes :Le manque de communication Et le fait que le phénomène de « churn » soit encore méconnu
Le churn peut représenter une Opportunité pour Un Telco
La solution que nous proposons se concrétise sur deux axes :InformatiqueOrganisationnelle
Le processus que nous pouvons mettre en place actuellement, si notre solution est adoptée.
Nous parlerons du choix des indicateurs, ainsi que l’ergonomie de l’interface choisie
Nous parlerons du choix des indicateurs, ainsi que l’ergonomie de l’interface choisie
Nous parlerons du choix des indicateurs, ainsi que l’ergonomie de l’interface choisie
On passe a Une conclusion, c'est quand vous en avez assez de penser.
1 Compréhension métier : nous avons effectué un benchmarking (cas d'étude étrangers)2 Compréhension des données : nous avons évaluer les données disponible au sein de 3 Préparation des données : nous avons structurer les données sous forme exploitable4 Modélisation : nous avons créer notre modèle de prédiction 5 Evaluation : nous avons évaluer les résultats obtenus en comptant le taux de bonne prédiction du modèle FIN Déploiement Données
1 Compréhension métier : nous avons effectué un benchmarking (cas d'étude étrangers)2 Compréhension des données : nous avons évaluer les données disponible au sein de 3 Préparation des données : nous avons structurer les données sous forme exploitable4 Modélisation : nous avons créer notre modèle de prédiction 5 Evaluation : nous avons évaluer les résultats obtenus en comptant le taux de bonne prédiction du modèle FIN Déploiement Données
Nous repèrerons les perspectives de notre rapport
Question sur la saturation (1 slide pour expliquer le concept)