SlideShare une entreprise Scribd logo
1  sur  25
Big Data Paris 2017
Accélérer la connaissance des clients et des risques grâce à la
donnée externe
Blue DME
Big Data Paris 2017
La genèse du XDStore
Big Data Paris 2017
Une conviction
3
Accélérer la connaissance des clients et la maitrise des risques grâce à
la donnée externe pour tous les data scientists du groupe
Big Data Paris 2017
Un constat
4
1 groupe historique de l’assurance, 3 marques
commerciales
- Un patrimoine de données internes et externes conséquent
- Mais aussi des silos historiques et organisationnels  Une
exploitation de la donnée externe difficile et épineuse
Big Data Paris 2017
Un catalyseur
5
Contexte exogène: Le deluge de la donnée (externe)
L’avènement de la donnée ouverte: + de 150 portails en
France*
*Source: OpenDataSoft, 2015, « La liste des portails open data dans le monde, https://www.opendatasoft.fr/ressource-liste-portails-open-data-dans-le-monde/
Big Data Paris 2017
Notre idée: Intégrer l’usage de la donnée externe dans le quotidien des statisticiens du
groupe
6
… en leur proposant un magasin partagé
et intelligent de la donnée externe
Big Data Paris 2017
L’eXternal Data Store
un projet de rupture à 4 points de vue
Big Data Paris 2017
1- Un catalogue unique pour les données externes
8
Un réceptacle unique et partagé de données
externes de sources diverses, composé
d’environ 2700 jeux de données de l’open
data
Big Data Paris 2017
2- Des données traitées, qualifiées, mises à jour, prêtes à l’emploi
9
Des jeux de données préparés, mis à jour,
certifiés, prêts à l’emploi avec une note
qualité qui permet d’estimer leurs valeurs
Big Data Paris 2017
3- Une plateforme de e-shopping de la donnée externe
10
Exploration du patrimoine de données externes
Amélioration de la connaissance d’un client ou d’un risque
Consultation du détail d’un jeu de données
Métadonnées (note qualité, like/dislike, commentaires, etc.)
Télécharger le jeu de données (initial ou enrichi)
Ajouter au favoris
La donnée externe devient une ressource disponible,
accessible et facile d’utilisation
Big Data Paris 2017
4- Des infos clés pour les data scientists et data analysts
11
Un service d’exploration automatique de la
donnée externe, qui permet aux data scientists
une valorisation immédiate de son apport
Big Data Paris 2017
Usage
Comment sélectionner la donnée?
Big Data Paris 2017
Deux utilisations: Une approche exploratoire
13
Naviguer dans le catalogue Consulter la « fiche descriptive » du jeu de données
« Zoomer » pour analyser le contenu du jeu de données via le
profiling
Partager son appréciation du jeu de données: like/dislike,
commentaire, etc.
Big Data Paris 2017
Deux utilisations: Une approche analytique – le XDMiner
14
Croiser un jeu de données interne avec
l’ensemble des jeux de données du
catalogue
Améliorer la pertinence d’un modèle de
prédiction en lui injectant des variables
exogènes
Big Data Paris 2017
Innovations technologiques dans le
projet XDStore
Big Data Paris 2017
Analyses systématiques et automatiques de toutes les données
16
Analyse sémantique
 Données géographiques
– Codes postaux, communes, quartiers IRIS…
– Coordonnées géographiques…
 Données d’entreprises
– SIREN…
 Données commerciales:
– Immatriculations véhicule…
Analyse technique et statistique
 Inférence de type
 Distribution, Cardinalité
 Catégories, variables continues
Big Data Paris 2017
Découverte des relations sous-jacentes avec les données externes
 Métadonnées (thèmes, tags)
 Sémantique des noms de colonne, des
contenus
 Distribution des données
…permettent de découvrir le graphe de
relations entre tous les jeux de données et
celui de l’utilisateur
17
Big Data Paris 2017
Algorithme automatisé d’enrichissement des données utilisateur
18
Analyse
automatique
Détermination de clé de
matching
• Inférence de type
• Inférence sémantique
(patterns)
• Mesure de distribution
et cardinalité
Matchings possibles
Identification de paires de
colonnes
• Matching strict
• Matching fuzzy
• Matching géographique
• Matching de données
anonymisées
Heuristiques
d’élimination
Algorithmes probabilistes
d’estimation de matching
Enrichissement
Exécution de la « jointure »
Enrichissement de la
donnée initiale avec des
infos externes
clients
age
code
commune
date
souscript°
Dataset
Utilisateur id_contrat
revenus
en FR
commune
3000
Datasets
Externes
rev
median
id_zone
XXX
XXX
Clé possible
Clé possible
Clé possible
Clé possible
Match
possible
Match
possible
Elimination
Nouvelle donnée
JOIN
Big Data Paris 2017
Des données internes trop limitées pour obtenir de bons modèles prédictifs
19
y = f (X)
Variable à prédire
(eg. « acheteur »)
0
1
0
0
1
0
…
y x1 x2 x3 … xn
32
23
56
71
19
24
…
75
92
33
18
01
13
…
VIP
PRO
Famille
Senior
15/25
STD
…
0.1
-0.7
0.0
0.5
0.8
0.4
…
…
Données internes
Big Data Paris 2017
Amélioration de modèles prédictifs par apport de données externes
20
y = f ’ ( X  X’ )
0
1
0
0
1
0
…
y x1 x2 x3 … xn
32
23
56
71
19
24
…
75
92
33
18
01
13
…
VIP
PRO
Famille
Senior
15/25
STD
…
0.1
-0.7
0.0
0.5
0.8
0.4
…
…
Données internes
1.2
5.6
8.9
0.0
5.4
12.0
…
1
1
0
0
1
1
…
852
741
56
96
963
654
…
x'1 x'2 … x'n
Variables exogènes
apportées
automatiquement
Un gain d’information
mesurable
Big Data Paris 2017
Plateforme technologique
21
• Language and
synonyms
Core technologique issu de la R&D Blue DME
XDStore co-construit avec COVEA
Big Data Paris 2017
Retours d’expérience
Big Data Paris 2017
Le XDStore: un projet collaboratif
23
La mise en œuvre du projet a nécessité des ressources
internes (métier et IT) et externes (la startup Blue DME)
Des ateliers de cadrage mais aussi de validation
avec les data scientists ont permis l’ajustement de
l’outil aux besoins
L’approche collaborative continue, une fois l’outil en production,
pour surveiller la qualité du catalogue, son utilisabilité et sa
pertinence
Phase de développement
Phase de production
Big Data Paris 2017
Transformer la donnée externe en levier
24
Amener la culture de la donnée externe
1
Accélérer le processus de valorisation de la
donnée externe
2
Faire profiter le groupe du patrimoine de
données externes  mettre en place une
gouvernance de la donnée externe
3
Big Data Paris 2017
Trophées de l’innovation Big Data -
Catégorie B2B: demain à 12h40
Votez pour nous !
Merci !
Venez nous voir au village startup !
Atelier Blue DME : demain à 10h30 en
salle D
Blue DMEBlue DME
Soumaya Ben Hassine
COVEA
@soumayabenhassi
Mathieu DESPRIEE
Blue DME
@mdespriee

Contenu connexe

Tendances

L'utilisation du Big Data en entreprise
L'utilisation du Big Data en entrepriseL'utilisation du Big Data en entreprise
L'utilisation du Big Data en entrepriseMathieu Lahaye
 
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILVMastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILVRomain Jouin
 
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIPrésentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIHaShem Selmi
 
Maximisez les bénéfices de votre BI self-service avec la Data Virtualization
Maximisez les bénéfices de votre BI self-service avec la Data VirtualizationMaximisez les bénéfices de votre BI self-service avec la Data Virtualization
Maximisez les bénéfices de votre BI self-service avec la Data VirtualizationDenodo
 
Big data et le marketing
Big data et le marketingBig data et le marketing
Big data et le marketingKhaled Fayala
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applicationsAffinity Engine
 
BIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligenceBIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligenceJulien DEMAUGÉ-BOST
 
Le Big Data au coeur de la stratégie des PME par où commencer ?
Le Big Data au coeur de la stratégie des PME par où commencer ? Le Big Data au coeur de la stratégie des PME par où commencer ?
Le Big Data au coeur de la stratégie des PME par où commencer ? Silicon Salad
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Parcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYParcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYTechnofutur TIC
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech
 
Webinar Base Plus : Piloter et décider autrement avec la Data Visualisation
Webinar Base Plus : Piloter et décider autrement avec la Data VisualisationWebinar Base Plus : Piloter et décider autrement avec la Data Visualisation
Webinar Base Plus : Piloter et décider autrement avec la Data VisualisationGroupe IDAIA
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
La valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usagesLa valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usagesSAS FRANCE
 
Livre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGLivre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGMargarita Zlatkova
 

Tendances (20)

L'utilisation du Big Data en entreprise
L'utilisation du Big Data en entrepriseL'utilisation du Big Data en entreprise
L'utilisation du Big Data en entreprise
 
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILVMastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
 
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIPrésentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
 
Maximisez les bénéfices de votre BI self-service avec la Data Virtualization
Maximisez les bénéfices de votre BI self-service avec la Data VirtualizationMaximisez les bénéfices de votre BI self-service avec la Data Virtualization
Maximisez les bénéfices de votre BI self-service avec la Data Virtualization
 
Technologies pour le Big Data
Technologies pour le Big DataTechnologies pour le Big Data
Technologies pour le Big Data
 
Programme Big Data
Programme Big DataProgramme Big Data
Programme Big Data
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Big data et le marketing
Big data et le marketingBig data et le marketing
Big data et le marketing
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
 
BIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligenceBIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligence
 
Le Big Data au coeur de la stratégie des PME par où commencer ?
Le Big Data au coeur de la stratégie des PME par où commencer ? Le Big Data au coeur de la stratégie des PME par où commencer ?
Le Big Data au coeur de la stratégie des PME par où commencer ?
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Introduction au BIG DATA
Introduction au BIG DATAIntroduction au BIG DATA
Introduction au BIG DATA
 
Parcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYParcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMY
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entreprise
 
Webinar Base Plus : Piloter et décider autrement avec la Data Visualisation
Webinar Base Plus : Piloter et décider autrement avec la Data VisualisationWebinar Base Plus : Piloter et décider autrement avec la Data Visualisation
Webinar Base Plus : Piloter et décider autrement avec la Data Visualisation
 
Big data
Big dataBig data
Big data
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
La valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usagesLa valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usages
 
Livre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGLivre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBG
 

En vedette

Présentation Eurocloud France - Cloud computing en France - Cédric Mora
Présentation Eurocloud France - Cloud computing en France - Cédric MoraPrésentation Eurocloud France - Cloud computing en France - Cédric Mora
Présentation Eurocloud France - Cloud computing en France - Cédric MoraCédric Mora
 
Monetisation des données - Conference Big Data Paris 2015
Monetisation des données - Conference Big Data Paris 2015Monetisation des données - Conference Big Data Paris 2015
Monetisation des données - Conference Big Data Paris 2015Blue DME
 
Fiche Produit Verteego Data Suite, mars 2017
Fiche Produit Verteego Data Suite, mars 2017Fiche Produit Verteego Data Suite, mars 2017
Fiche Produit Verteego Data Suite, mars 2017Jeremy Fain
 
Verteego Data Suite : support du lancement
Verteego Data Suite : support du lancementVerteego Data Suite : support du lancement
Verteego Data Suite : support du lancementJeremy Fain
 
Market Research Report : Hb a1c testing market in india 2013
Market Research Report : Hb a1c testing market in india 2013Market Research Report : Hb a1c testing market in india 2013
Market Research Report : Hb a1c testing market in india 2013Netscribes, Inc.
 
Assurez la confidentialité et la sécurité de vos données stratégiques - Oodrive
Assurez la confidentialité et la sécurité de vos données stratégiques - OodriveAssurez la confidentialité et la sécurité de vos données stratégiques - Oodrive
Assurez la confidentialité et la sécurité de vos données stratégiques - OodriveHélène Toutchkov
 
R2DOCX : R + WORD
R2DOCX : R + WORDR2DOCX : R + WORD
R2DOCX : R + WORDCdiscount
 
Introduction- Big Data en Santé - conférence du 16 juin 2016
Introduction- Big Data en Santé - conférence du 16 juin 2016Introduction- Big Data en Santé - conférence du 16 juin 2016
Introduction- Big Data en Santé - conférence du 16 juin 2016TELECOM-PARISTECH-SANTE
 
Cartographie du big data
Cartographie du big dataCartographie du big data
Cartographie du big dataacogoluegnes
 
Conference data day maif - 24 janvier 2017 cyril chedhomme
Conference data day   maif - 24 janvier 2017 cyril chedhommeConference data day   maif - 24 janvier 2017 cyril chedhomme
Conference data day maif - 24 janvier 2017 cyril chedhommeCyril CHEDHOMME
 
Presentation r markdown
Presentation r markdown Presentation r markdown
Presentation r markdown Cdiscount
 
Data Exchange Platform Blue DME - Trouver de la donnée pertinente
Data Exchange Platform Blue DME - Trouver de la donnée pertinenteData Exchange Platform Blue DME - Trouver de la donnée pertinente
Data Exchange Platform Blue DME - Trouver de la donnée pertinenteMathieu DESPRIEE
 
Comment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteComment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteAntidot
 
JPO Legal Status Data, Part I: Overview
JPO Legal Status Data, Part I: OverviewJPO Legal Status Data, Part I: Overview
JPO Legal Status Data, Part I: OverviewAlan Engel
 

En vedette (20)

Présentation Eurocloud France - Cloud computing en France - Cédric Mora
Présentation Eurocloud France - Cloud computing en France - Cédric MoraPrésentation Eurocloud France - Cloud computing en France - Cédric Mora
Présentation Eurocloud France - Cloud computing en France - Cédric Mora
 
Monetisation des données - Conference Big Data Paris 2015
Monetisation des données - Conference Big Data Paris 2015Monetisation des données - Conference Big Data Paris 2015
Monetisation des données - Conference Big Data Paris 2015
 
Fiche Produit Verteego Data Suite, mars 2017
Fiche Produit Verteego Data Suite, mars 2017Fiche Produit Verteego Data Suite, mars 2017
Fiche Produit Verteego Data Suite, mars 2017
 
Verteego Data Suite : support du lancement
Verteego Data Suite : support du lancementVerteego Data Suite : support du lancement
Verteego Data Suite : support du lancement
 
Market Research Report : Hb a1c testing market in india 2013
Market Research Report : Hb a1c testing market in india 2013Market Research Report : Hb a1c testing market in india 2013
Market Research Report : Hb a1c testing market in india 2013
 
Assurez la confidentialité et la sécurité de vos données stratégiques - Oodrive
Assurez la confidentialité et la sécurité de vos données stratégiques - OodriveAssurez la confidentialité et la sécurité de vos données stratégiques - Oodrive
Assurez la confidentialité et la sécurité de vos données stratégiques - Oodrive
 
Gur1009
Gur1009Gur1009
Gur1009
 
R2DOCX : R + WORD
R2DOCX : R + WORDR2DOCX : R + WORD
R2DOCX : R + WORD
 
Big data with r
Big data with rBig data with r
Big data with r
 
Introduction- Big Data en Santé - conférence du 16 juin 2016
Introduction- Big Data en Santé - conférence du 16 juin 2016Introduction- Big Data en Santé - conférence du 16 juin 2016
Introduction- Big Data en Santé - conférence du 16 juin 2016
 
R Devtools
R DevtoolsR Devtools
R Devtools
 
Cartographie du big data
Cartographie du big dataCartographie du big data
Cartographie du big data
 
Conference data day maif - 24 janvier 2017 cyril chedhomme
Conference data day   maif - 24 janvier 2017 cyril chedhommeConference data day   maif - 24 janvier 2017 cyril chedhomme
Conference data day maif - 24 janvier 2017 cyril chedhomme
 
Presentation r markdown
Presentation r markdown Presentation r markdown
Presentation r markdown
 
Data Exchange Platform Blue DME - Trouver de la donnée pertinente
Data Exchange Platform Blue DME - Trouver de la donnée pertinenteData Exchange Platform Blue DME - Trouver de la donnée pertinente
Data Exchange Platform Blue DME - Trouver de la donnée pertinente
 
Comment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteComment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texte
 
Modern Veri Ambarı_Cem Kubilay
Modern Veri Ambarı_Cem KubilayModern Veri Ambarı_Cem Kubilay
Modern Veri Ambarı_Cem Kubilay
 
R versur Python
R versur PythonR versur Python
R versur Python
 
Ipsen Big Data
Ipsen  Big DataIpsen  Big Data
Ipsen Big Data
 
JPO Legal Status Data, Part I: Overview
JPO Legal Status Data, Part I: OverviewJPO Legal Status Data, Part I: Overview
JPO Legal Status Data, Part I: Overview
 

Similaire à Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'assurance. Présentation Salon Big Data Paris 2017

Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceHélène Etienne
 
Big Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseBig Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseGenève Lab
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015IBM France Lab
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceExcelerate Systems
 
Big data en (ré)assurance régis delayet
Big data en (ré)assurance   régis delayetBig data en (ré)assurance   régis delayet
Big data en (ré)assurance régis delayetKezhan SHI
 
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...Antidot
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013ADBS
 
Utilisation du big data en entreprise
Utilisation du big data en entrepriseUtilisation du big data en entreprise
Utilisation du big data en entreprisePierrick Thébault
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurMicrosoft Ideas
 
DataScience_usage_interet_wagon_bordeaux
DataScience_usage_interet_wagon_bordeauxDataScience_usage_interet_wagon_bordeaux
DataScience_usage_interet_wagon_bordeauxArmand GILLES
 
Webinaire Business&Decision - Trifacta
Webinaire  Business&Decision - TrifactaWebinaire  Business&Decision - Trifacta
Webinaire Business&Decision - TrifactaVictor Coustenoble
 
Le Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoBLe Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoBSparklane
 
Analytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationAnalytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationDenodo
 
Data Breakfast : La transformation digitale à l'heure de la data
Data Breakfast : La transformation digitale à l'heure de la dataData Breakfast : La transformation digitale à l'heure de la data
Data Breakfast : La transformation digitale à l'heure de la dataConverteo
 
Big data-2-170220212621
Big data-2-170220212621Big data-2-170220212621
Big data-2-170220212621Haifa Akermi
 
Arrow Group: Techday Big Data - Etat et Enjeu pour l'Assurance
Arrow Group: Techday Big Data - Etat et Enjeu pour l'AssuranceArrow Group: Techday Big Data - Etat et Enjeu pour l'Assurance
Arrow Group: Techday Big Data - Etat et Enjeu pour l'AssuranceArrow Group
 
HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUB INSTITUTE
 

Similaire à Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'assurance. Présentation Salon Big Data Paris 2017 (20)

Introduction
IntroductionIntroduction
Introduction
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
 
Utc data publica1
Utc data publica1Utc data publica1
Utc data publica1
 
BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node
 
Big Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseBig Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entreprise
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems France
 
Big data en (ré)assurance régis delayet
Big data en (ré)assurance   régis delayetBig data en (ré)assurance   régis delayet
Big data en (ré)assurance régis delayet
 
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
Utilisation du big data en entreprise
Utilisation du big data en entrepriseUtilisation du big data en entreprise
Utilisation du big data en entreprise
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
 
DataScience_usage_interet_wagon_bordeaux
DataScience_usage_interet_wagon_bordeauxDataScience_usage_interet_wagon_bordeaux
DataScience_usage_interet_wagon_bordeaux
 
Webinaire Business&Decision - Trifacta
Webinaire  Business&Decision - TrifactaWebinaire  Business&Decision - Trifacta
Webinaire Business&Decision - Trifacta
 
Le Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoBLe Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoB
 
Analytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationAnalytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data Virtualization
 
Data Breakfast : La transformation digitale à l'heure de la data
Data Breakfast : La transformation digitale à l'heure de la dataData Breakfast : La transformation digitale à l'heure de la data
Data Breakfast : La transformation digitale à l'heure de la data
 
Big data-2-170220212621
Big data-2-170220212621Big data-2-170220212621
Big data-2-170220212621
 
Arrow Group: Techday Big Data - Etat et Enjeu pour l'Assurance
Arrow Group: Techday Big Data - Etat et Enjeu pour l'AssuranceArrow Group: Techday Big Data - Etat et Enjeu pour l'Assurance
Arrow Group: Techday Big Data - Etat et Enjeu pour l'Assurance
 
HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]
 

Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'assurance. Présentation Salon Big Data Paris 2017

  • 1. Big Data Paris 2017 Accélérer la connaissance des clients et des risques grâce à la donnée externe Blue DME
  • 2. Big Data Paris 2017 La genèse du XDStore
  • 3. Big Data Paris 2017 Une conviction 3 Accélérer la connaissance des clients et la maitrise des risques grâce à la donnée externe pour tous les data scientists du groupe
  • 4. Big Data Paris 2017 Un constat 4 1 groupe historique de l’assurance, 3 marques commerciales - Un patrimoine de données internes et externes conséquent - Mais aussi des silos historiques et organisationnels  Une exploitation de la donnée externe difficile et épineuse
  • 5. Big Data Paris 2017 Un catalyseur 5 Contexte exogène: Le deluge de la donnée (externe) L’avènement de la donnée ouverte: + de 150 portails en France* *Source: OpenDataSoft, 2015, « La liste des portails open data dans le monde, https://www.opendatasoft.fr/ressource-liste-portails-open-data-dans-le-monde/
  • 6. Big Data Paris 2017 Notre idée: Intégrer l’usage de la donnée externe dans le quotidien des statisticiens du groupe 6 … en leur proposant un magasin partagé et intelligent de la donnée externe
  • 7. Big Data Paris 2017 L’eXternal Data Store un projet de rupture à 4 points de vue
  • 8. Big Data Paris 2017 1- Un catalogue unique pour les données externes 8 Un réceptacle unique et partagé de données externes de sources diverses, composé d’environ 2700 jeux de données de l’open data
  • 9. Big Data Paris 2017 2- Des données traitées, qualifiées, mises à jour, prêtes à l’emploi 9 Des jeux de données préparés, mis à jour, certifiés, prêts à l’emploi avec une note qualité qui permet d’estimer leurs valeurs
  • 10. Big Data Paris 2017 3- Une plateforme de e-shopping de la donnée externe 10 Exploration du patrimoine de données externes Amélioration de la connaissance d’un client ou d’un risque Consultation du détail d’un jeu de données Métadonnées (note qualité, like/dislike, commentaires, etc.) Télécharger le jeu de données (initial ou enrichi) Ajouter au favoris La donnée externe devient une ressource disponible, accessible et facile d’utilisation
  • 11. Big Data Paris 2017 4- Des infos clés pour les data scientists et data analysts 11 Un service d’exploration automatique de la donnée externe, qui permet aux data scientists une valorisation immédiate de son apport
  • 12. Big Data Paris 2017 Usage Comment sélectionner la donnée?
  • 13. Big Data Paris 2017 Deux utilisations: Une approche exploratoire 13 Naviguer dans le catalogue Consulter la « fiche descriptive » du jeu de données « Zoomer » pour analyser le contenu du jeu de données via le profiling Partager son appréciation du jeu de données: like/dislike, commentaire, etc.
  • 14. Big Data Paris 2017 Deux utilisations: Une approche analytique – le XDMiner 14 Croiser un jeu de données interne avec l’ensemble des jeux de données du catalogue Améliorer la pertinence d’un modèle de prédiction en lui injectant des variables exogènes
  • 15. Big Data Paris 2017 Innovations technologiques dans le projet XDStore
  • 16. Big Data Paris 2017 Analyses systématiques et automatiques de toutes les données 16 Analyse sémantique  Données géographiques – Codes postaux, communes, quartiers IRIS… – Coordonnées géographiques…  Données d’entreprises – SIREN…  Données commerciales: – Immatriculations véhicule… Analyse technique et statistique  Inférence de type  Distribution, Cardinalité  Catégories, variables continues
  • 17. Big Data Paris 2017 Découverte des relations sous-jacentes avec les données externes  Métadonnées (thèmes, tags)  Sémantique des noms de colonne, des contenus  Distribution des données …permettent de découvrir le graphe de relations entre tous les jeux de données et celui de l’utilisateur 17
  • 18. Big Data Paris 2017 Algorithme automatisé d’enrichissement des données utilisateur 18 Analyse automatique Détermination de clé de matching • Inférence de type • Inférence sémantique (patterns) • Mesure de distribution et cardinalité Matchings possibles Identification de paires de colonnes • Matching strict • Matching fuzzy • Matching géographique • Matching de données anonymisées Heuristiques d’élimination Algorithmes probabilistes d’estimation de matching Enrichissement Exécution de la « jointure » Enrichissement de la donnée initiale avec des infos externes clients age code commune date souscript° Dataset Utilisateur id_contrat revenus en FR commune 3000 Datasets Externes rev median id_zone XXX XXX Clé possible Clé possible Clé possible Clé possible Match possible Match possible Elimination Nouvelle donnée JOIN
  • 19. Big Data Paris 2017 Des données internes trop limitées pour obtenir de bons modèles prédictifs 19 y = f (X) Variable à prédire (eg. « acheteur ») 0 1 0 0 1 0 … y x1 x2 x3 … xn 32 23 56 71 19 24 … 75 92 33 18 01 13 … VIP PRO Famille Senior 15/25 STD … 0.1 -0.7 0.0 0.5 0.8 0.4 … … Données internes
  • 20. Big Data Paris 2017 Amélioration de modèles prédictifs par apport de données externes 20 y = f ’ ( X  X’ ) 0 1 0 0 1 0 … y x1 x2 x3 … xn 32 23 56 71 19 24 … 75 92 33 18 01 13 … VIP PRO Famille Senior 15/25 STD … 0.1 -0.7 0.0 0.5 0.8 0.4 … … Données internes 1.2 5.6 8.9 0.0 5.4 12.0 … 1 1 0 0 1 1 … 852 741 56 96 963 654 … x'1 x'2 … x'n Variables exogènes apportées automatiquement Un gain d’information mesurable
  • 21. Big Data Paris 2017 Plateforme technologique 21 • Language and synonyms Core technologique issu de la R&D Blue DME XDStore co-construit avec COVEA
  • 22. Big Data Paris 2017 Retours d’expérience
  • 23. Big Data Paris 2017 Le XDStore: un projet collaboratif 23 La mise en œuvre du projet a nécessité des ressources internes (métier et IT) et externes (la startup Blue DME) Des ateliers de cadrage mais aussi de validation avec les data scientists ont permis l’ajustement de l’outil aux besoins L’approche collaborative continue, une fois l’outil en production, pour surveiller la qualité du catalogue, son utilisabilité et sa pertinence Phase de développement Phase de production
  • 24. Big Data Paris 2017 Transformer la donnée externe en levier 24 Amener la culture de la donnée externe 1 Accélérer le processus de valorisation de la donnée externe 2 Faire profiter le groupe du patrimoine de données externes  mettre en place une gouvernance de la donnée externe 3
  • 25. Big Data Paris 2017 Trophées de l’innovation Big Data - Catégorie B2B: demain à 12h40 Votez pour nous ! Merci ! Venez nous voir au village startup ! Atelier Blue DME : demain à 10h30 en salle D Blue DMEBlue DME Soumaya Ben Hassine COVEA @soumayabenhassi Mathieu DESPRIEE Blue DME @mdespriee