SlideShare une entreprise Scribd logo
1  sur  17
Télécharger pour lire hors ligne
Entreposer ses données
Préservation et partage 
Jean‐Christophe Desconnets ‐ MIDN
Pascal Aventurier, Caroline Doucouré, Hanka Hensens, Luc Decker ‐ IST/MCST 
Stéphane Banon ‐ D‐DUNI  
https://libereurope.eu/wp‐content/uploads/PARSE‐Insight_D3‐5_InterimInsightReport_final.pdf
Données en danger ! 
Perte de 17 % par an   (Pierre Corvol ,Collège de France)
Reproductibilité des expériences ?
1500 chercheurs répondent à Nature
“More than 70% of 
researchers have 
tried and failed to 
reproduce another 
scientist's 
experiments, and 
more than half 
have failed to 
reproduce their 
own experiments”
Nature may 2016 :  https://www.nature.com/news/1‐500‐scientists‐lift‐the‐lid‐on‐reproducibility‐1.19970
4
Exemple : réutilisation des données en Astronomie
Les données archivées sont davantage utilisées et
citées que les données récentes
https://archive.stsci.edu/hst/bibliography/pubstat.html
Pourquoi partager les données ?
Entre injonctions et bénéfices
Augmenter ces citations
Le partage des données 
augmente l’attractivité 
de l’article jusqu’à 69% 
Étendre son réseau
nouvelle opportunité 
pour 
échanger/collaborer
Attirer sur son profil 
chercheur
La demande pour réutiliser 
les données est en forte 
hausse
Renforcer ses possibilités 
de recevoir des 
financements
Compatibilité avec les 
exigences des financeurs
Reproductibilité
Preuve 
Résultats accessibles à tous public
Préservation 
Description et visibilité
Pilote données ouvertes par défaut 
Wiley
Incitation 
ou 
obligation 
de partage
Protocole de
Nagoya 
Principes FAIR : augmenter le potentiel des données 
6
• Licence d’utilisation 
appropriée
• Formats ouverts
• Vocabulaires partagés  
• Standards de 
métadonnées communs
• Gérer de façon pérenne 
l’accès aux données
• Obtenir l’accord des 
producteurs 
• Identifiants pérennes
• Décrire les données au 
sein d’un entrepôt
Facile à 
trouver
Accessible
RéutilisableInteropérable
Plan national pour la science ouverte (2018)
3 axes concrets
Axe 1 : Généraliser l’accès ouvert aux publications
Axe 2 : Structurer et ouvrir les données de la recherche
Inciter à la diffusion ouverte des données
Créer la fonction d’administrateur des données par établissement
Données ouvertes associées aux articles scientifiques
Axe 3 : s’inscrire dans une dynamique durable,
européenne et internationale
7
8
INRA 
 Site web dédié et entrepôt  de données
 Annuaire développé dans l’entrepôt de données
 Formations : Plan de gestion de données
 Liens entre données et documents (Prodinra)
CNRS
 TGIR HUMA‐NUM, Nakala (entrepôt)
Ifremer
 Entrepôt de données SEANOE
 Entrepôt de documents Archimer
CIRAD 
 Entrepôt de données Dataverse
 Formations : Plan de gestion de données
Science Po 
 Entrepôt de données Dataverse du CDSP
INRIA
 Software héritage pour le dépôt des codes sources
IRD : entrepôt de données DataSuds, lancé Sept.2019
Ecosystème pour la science ouverte en France
en progression dans les instituts de recherche
Questions soulevées par l’ouverture des données
1. C’est compliqué. C’est la raison pour laquelle les
infrastructures de données et les plans de gestion des
données existent.
2. C’est cher. C’est la raison pour laquelle les frais de
structuration et d’ouverture sont éligibles dans les appels à
projets.
3. C’est risqué pour les données sensibles (personnelles,
sécurité publique, secret professionnel, secret industriel et
commercial.)
Marin Dacos, 27/03/2018 : Ouverture des données de la recherche  DGESIP ‐ DGRI Journée sur le doctorat 
Aussi ouvert que possible, aussi fermé que nécessaire
Service en ligne permettant le dépôt, la description, la 
conservation, la recherche et la diffusion des jeux de 
données. 
Entrepôts : disciplinaires / institutionnels / ouverts à toutes 
disciplines / infrastructures nationales, internationales
D’après Sylvie Cocaud. Cocaud et Aventurier 2017
Entrepôt de données de recherche : définition
A quoi sert un entrepôt de données ?
 Visibilité, partage et accès aux données 
des Unités et projets de recherche
 Maîtrise de la diffusion des données 
(licence, niveau d’accès…)
 Ethique : rendre les données plus 
facilement accessible à vos partenaires du 
sud, obtenir leur accord pour la diffusion
 Valorisation : être visible pour susciter des 
collaborations domaine de la recherche et 
secteur privé
11
Identificationdescriptiondécouverte
stockage
dépôt
Changer les pratiques de gestion des données
12
oubli
destruction
Conception projet
de recherche
démarrage
projet
acquisition de
données
Analyse de
données
publication
résultats
fin projet
cycle de vie au cours du projet
cycle de vie dans l’entrepôt
bornes du projet
valorisation
partage
nouvelles
publications
citations
réutilisation
Conception projet
de recherche
démarrage
projet
acquisition de
données
Analyse de
données
publication
résultats
fin projet
Plan de
gestion de
données
Partage de données : alimenter les intelligences artificielles
13
Big 
data
Machine learning
(apprentissage 
automatique)
Entrepôt
Jeu de données
Data paper
Fonctionnement d’un entrepôt de données
Appui juridique, Supports 
d’accompagnement, 
Hotline pour répondre 
aux questions 
• Formation de référents et administrateurs de données 
• Espaces de dépôt personnalisables pour Unités, 
équipes, projets…
Description
et dépôt
de données
Validation du 
dépôt par 
IST/personne 
désignée 
Publication du 
jeu de données 
Référencement 
dans les 
moteurs et les 
outils de 
recherche 
Données FAIR
En accord avec un Plan de Gestion 
de Données, dépôt et description de 
jeu de données dans  des formats 
standardisés
(ouvert / fermé /embargo / 
métadonnées seules)
DataSuds
l’entrepôt de données 
institutionnel de l’IRD 
17
Positionnement
Données cibles
Données non structurées, non 
numérisées, enfouies dans les PCs, 
historiques, non rattachées à des bases 
accessibles en interne ou externe
Observatoires, pôles de 
données, base de données 
accessibles sur le web
Source : distribution des données de la recherche  (Ferguson et al., 2014)
 Accueillir les données que les chercheurs souhaitent déposer, partager
 Rendre les données: Facile à trouver, Accessible, Interopérable, Réutilisable
 Complémentarité entre les différents entrepôts
Des objectifs raisonnables…
 Nombreuses attentes des scientifiques dans des contextes variés
 Valorisation , préservation, attribution de DOI, partage ….
…pour répondre aux besoins des chercheurs 
Conclusion
 Améliorer la connaissance et la gestion du patrimoine de données
 Une étape concrète vers une politique de science ouverte
…au service des Instituts de Recherche 

Contenu connexe

Similaire à Entreposer donnees decker-atelier-data_suds_20191118

ProdInra / VOA3R, une approche complémentaire dans le repérage de l'expertise...
ProdInra / VOA3R, une approche complémentaire dans le repérage de l'expertise...ProdInra / VOA3R, une approche complémentaire dans le repérage de l'expertise...
ProdInra / VOA3R, une approche complémentaire dans le repérage de l'expertise...Diane Le Hénaff
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017Bertrand Tavitian
 
Ethique publications-scientifiques-authorship-2010-pvn
Ethique publications-scientifiques-authorship-2010-pvnEthique publications-scientifiques-authorship-2010-pvn
Ethique publications-scientifiques-authorship-2010-pvnPatricia Volland-Nail
 
Usage des nouvelles technologies en éducation thérapeutique DU esanté
Usage des nouvelles technologies en éducation thérapeutique DU esantéUsage des nouvelles technologies en éducation thérapeutique DU esanté
Usage des nouvelles technologies en éducation thérapeutique DU esantéKarimSandid
 
Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Alberto González-Talaván
 
Enseignement à distance semi-industriel, une approche systémique de la plate-...
Enseignement à distance semi-industriel, une approche systémique de la plate-...Enseignement à distance semi-industriel, une approche systémique de la plate-...
Enseignement à distance semi-industriel, une approche systémique de la plate-...Claude Tarrit
 
Open Access Open Science : Quelles transformations pour la recherche?
Open Access Open Science : Quelles transformations pour la recherche? Open Access Open Science : Quelles transformations pour la recherche?
Open Access Open Science : Quelles transformations pour la recherche? Célya Gruson-Daniel
 
L'accès libre des articles scientifiques évalués par des pairs et l'état des ...
L'accès libre des articles scientifiques évalués par des pairs et l'état des ...L'accès libre des articles scientifiques évalués par des pairs et l'état des ...
L'accès libre des articles scientifiques évalués par des pairs et l'état des ...1science
 
OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...Thierry Chanier
 
Une introduction aux données de la recherche. Journée d'Etude Agropolis Montp...
Une introduction aux données de la recherche. Journée d'Etude Agropolis Montp...Une introduction aux données de la recherche. Journée d'Etude Agropolis Montp...
Une introduction aux données de la recherche. Journée d'Etude Agropolis Montp...pascal aventurier
 
Les réseaux sociaux pour les scientifiques
Les réseaux sociaux pour les scientifiquesLes réseaux sociaux pour les scientifiques
Les réseaux sociaux pour les scientifiquespascal aventurier
 
Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...Esther Kaboré Dzalé
 
64% des Français sont opposés à l’utilisation des animaux par la recherche sc...
64% des Français sont opposés à l’utilisation des animaux par la recherche sc...64% des Français sont opposés à l’utilisation des animaux par la recherche sc...
64% des Français sont opposés à l’utilisation des animaux par la recherche sc...Ipsos France
 
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Cairn.info
 
Fouille de textes et cartographie thématique des corpus numériques
Fouille de textes et cartographie thématique des corpus numériquesFouille de textes et cartographie thématique des corpus numériques
Fouille de textes et cartographie thématique des corpus numériquesÉrudit
 

Similaire à Entreposer donnees decker-atelier-data_suds_20191118 (20)

ProdInra / VOA3R, une approche complémentaire dans le repérage de l'expertise...
ProdInra / VOA3R, une approche complémentaire dans le repérage de l'expertise...ProdInra / VOA3R, une approche complémentaire dans le repérage de l'expertise...
ProdInra / VOA3R, une approche complémentaire dans le repérage de l'expertise...
 
Ns jo bim2011 fr
Ns jo bim2011 frNs jo bim2011 fr
Ns jo bim2011 fr
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017
 
Projet Nextic
Projet NexticProjet Nextic
Projet Nextic
 
Ethique publications-scientifiques-authorship-2010-pvn
Ethique publications-scientifiques-authorship-2010-pvnEthique publications-scientifiques-authorship-2010-pvn
Ethique publications-scientifiques-authorship-2010-pvn
 
M1 AGIS - recherche documentaire
M1  AGIS - recherche documentaire M1  AGIS - recherche documentaire
M1 AGIS - recherche documentaire
 
Usage des nouvelles technologies en éducation thérapeutique DU esanté
Usage des nouvelles technologies en éducation thérapeutique DU esantéUsage des nouvelles technologies en éducation thérapeutique DU esanté
Usage des nouvelles technologies en éducation thérapeutique DU esanté
 
Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...
 
Enseignement à distance semi-industriel, une approche systémique de la plate-...
Enseignement à distance semi-industriel, une approche systémique de la plate-...Enseignement à distance semi-industriel, une approche systémique de la plate-...
Enseignement à distance semi-industriel, une approche systémique de la plate-...
 
Open Access Open Science : Quelles transformations pour la recherche?
Open Access Open Science : Quelles transformations pour la recherche? Open Access Open Science : Quelles transformations pour la recherche?
Open Access Open Science : Quelles transformations pour la recherche?
 
L'accès libre des articles scientifiques évalués par des pairs et l'état des ...
L'accès libre des articles scientifiques évalués par des pairs et l'état des ...L'accès libre des articles scientifiques évalués par des pairs et l'état des ...
L'accès libre des articles scientifiques évalués par des pairs et l'état des ...
 
OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...
 
Une introduction aux données de la recherche. Journée d'Etude Agropolis Montp...
Une introduction aux données de la recherche. Journée d'Etude Agropolis Montp...Une introduction aux données de la recherche. Journée d'Etude Agropolis Montp...
Une introduction aux données de la recherche. Journée d'Etude Agropolis Montp...
 
Les réseaux sociaux pour les scientifiques
Les réseaux sociaux pour les scientifiquesLes réseaux sociaux pour les scientifiques
Les réseaux sociaux pour les scientifiques
 
Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...
 
64% des Français sont opposés à l’utilisation des animaux par la recherche sc...
64% des Français sont opposés à l’utilisation des animaux par la recherche sc...64% des Français sont opposés à l’utilisation des animaux par la recherche sc...
64% des Français sont opposés à l’utilisation des animaux par la recherche sc...
 
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
 
Fouille de textes et cartographie thématique des corpus numériques
Fouille de textes et cartographie thématique des corpus numériquesFouille de textes et cartographie thématique des corpus numériques
Fouille de textes et cartographie thématique des corpus numériques
 
Introduction aux données de la recherche
Introduction aux données de la rechercheIntroduction aux données de la recherche
Introduction aux données de la recherche
 
CNED Poitiers 2019
CNED Poitiers 2019CNED Poitiers 2019
CNED Poitiers 2019
 

Plus de IST IRD - Service IST de l'Institut de Recherche pour le Développement

Plus de IST IRD - Service IST de l'Institut de Recherche pour le Développement (20)

Projets de coopération en Information Scientifique et Technique (IST)_Marc Go...
Projets de coopération en Information Scientifique et Technique (IST)_Marc Go...Projets de coopération en Information Scientifique et Technique (IST)_Marc Go...
Projets de coopération en Information Scientifique et Technique (IST)_Marc Go...
 
Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...
Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...
Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...
 
Documentation IRD Occitanie : Outils et Services
Documentation IRD Occitanie : Outils et ServicesDocumentation IRD Occitanie : Outils et Services
Documentation IRD Occitanie : Outils et Services
 
Introduction au Plan de Gestion de Données
Introduction au Plan de Gestion de DonnéesIntroduction au Plan de Gestion de Données
Introduction au Plan de Gestion de Données
 
Migration end note-zotero
Migration end note-zoteroMigration end note-zotero
Migration end note-zotero
 
Zotero5 perfectionnement
Zotero5 perfectionnementZotero5 perfectionnement
Zotero5 perfectionnement
 
Zotero5 initiation
Zotero5 initiationZotero5 initiation
Zotero5 initiation
 
APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...
APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...
APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...
 
Signature des Publications Scientifiques_David Pontille_JeudIST IRD 20190516
Signature des Publications Scientifiques_David Pontille_JeudIST IRD  20190516Signature des Publications Scientifiques_David Pontille_JeudIST IRD  20190516
Signature des Publications Scientifiques_David Pontille_JeudIST IRD 20190516
 
GBIF Jeudist IRD_20190418
GBIF Jeudist IRD_20190418GBIF Jeudist IRD_20190418
GBIF Jeudist IRD_20190418
 
Poster Dataverse IRD JNSO 2018
Poster Dataverse IRD JNSO 2018Poster Dataverse IRD JNSO 2018
Poster Dataverse IRD JNSO 2018
 
End Note X8 - Hensens Hanka - 2017
End Note X8 - Hensens Hanka - 2017 End Note X8 - Hensens Hanka - 2017
End Note X8 - Hensens Hanka - 2017
 
Opendata repository-Gabarone,20181108
Opendata repository-Gabarone,20181108Opendata repository-Gabarone,20181108
Opendata repository-Gabarone,20181108
 
Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018
Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018
Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018
 
Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018
Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018
Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018
 
Equation de recherche
Equation de rechercheEquation de recherche
Equation de recherche
 
Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...
Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...
Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...
 
Gerer ses données avec un Plan de Gestion de Donnees (PGD/DMP). 20/09/2018. J...
Gerer ses données avec un Plan de Gestion de Donnees (PGD/DMP). 20/09/2018. J...Gerer ses données avec un Plan de Gestion de Donnees (PGD/DMP). 20/09/2018. J...
Gerer ses données avec un Plan de Gestion de Donnees (PGD/DMP). 20/09/2018. J...
 
Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...
Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...
Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...
 
Parcours de recherche documentaire. Hanka Hensens. 15/05/2018
Parcours de recherche documentaire. Hanka Hensens. 15/05/2018Parcours de recherche documentaire. Hanka Hensens. 15/05/2018
Parcours de recherche documentaire. Hanka Hensens. 15/05/2018
 

Dernier

Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 
analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxHadJer61
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 

Dernier (6)

Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 
analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptx
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 

Entreposer donnees decker-atelier-data_suds_20191118