SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
Migration et import de données
Avec Alfresco et l’ETL Talend
Marc Dutoo - Alfresco Meetup - 30 Avril 2009
2
Agenda
Qui sommes-nous ?
Problématiques de l’import de données
La réponse ETL Connector & Talend
Architecture
Démonstration
Questions
3
Qui sommes-nous ?
Open Wide – architecte Open Source
~ 90 employés sur Paris et Lyon, spin off de Thalès
Portail, gestion documentaire, Business Intelligence…
Offre de services pour les logiciels libres couvrant tout
le cycle
► Industrialisation de l’usage des composants Open Source,
pour les grands comptes et les administrations
Marc Dutoo – architecte GED / SOA / BPM
Conseil, formations, projets
Responsable R&D (Eclipse JWT, OW2 Scarbo…)
4
Open Wide et Alfresco
Partenaire Gold depuis plus de 3 ans
L’assurance de la qualité
L’assurance de l’engagement de l’éditeur à nos côtés
De nombreux projets réalisés
et en production
Une expertise de haut niveau
de l’intégration et de la solution
5
Problématique
Pour pouvoir gérer des documents, il faut qu’ils soient
dans Alfresco !
Une entreprise a toujours des documents antérieurs à
l’introduction Alfresco
► Ne serait-ce qu’un dossier partagé en réseau
Et en sus des documents, souvent une organisation, une
classification, voire des métadonnées métier
► Fichiers d’index
► Fichiers de métadonnées scannés (dématérialisation)
► Métier : wiki, base de données, application…
NB. On écarte la migration de version ☺
6
Cas d’usage 1 – Flexibilité et simplicité
« Peu » de documents et de méta-informations, classification
antérieure non formalisée, besoin ponctuel
Exemple : KM et Intranet de collectivités locales
Solution : Flexibilité et simplicité
Action automatique avalant un fichier index
► Les documents sont déposés dans Alfresco dans un espace technique
► Puis un index global les référence et fournit classification et métadonnées
Architecture
► Action abstraite à étendre avec le code de classification métier
► Autorise toute opération lors de la classification
Adapté au partage de connaissances…
7
Cas d’usage 2 – Performance
Nombreux documents, import récurrent, classification
formalisée
Exemple : Miauton (CH, Bâtiment, 5000 factures / jour)
Solution : performance et évolutivité
Import automatique des documents déposés dans un dossier sur le
système de fichier, chacun avec son fichier de métadonnées
Architecture
► Polling threadé
► Index : optimisation, amélioration du volume (avec Alfresco)
► Evolutif : autres documents métier, scanner / OCR (Kofax, Readsoft…)
Adapté à la dématérialisation !
8
Cas d’usage 3 – Versatilité
Beaucoup de documents, de métadonnées, plan de classement
établi, récurrence…
Flexibilité, mais pas de passer du temps sur du code jetable !
Exemple : Habitat 76
Solution : versatilité
Intégration d’outillage ETL (Extract, Transform, Load)
► Principe de l’ETL : introspection des données (fichier, base…) et design de
leurs flux d’intégration (« jobs »)
Réalisation : ETLConnector pour Talend
► En contribution sur la forge Alfresco (projet etlconnector)
► Talend : ETL Open Source, leader mondial, basé sur Eclipse, français
9
ETL Connector – Présentation
Projet en collaboration
► entre Habitat 76 (besoin et fonctionnel), Open Wide (conception et
développement), Talend (support)
L’utiliser
► Fourni avec Talend 3.1RC3
► Validé avec Alfresco 2.1 et 2.9b, erreurs mineurs en 3 Stable
► Tutorial : http://nicolas.feray.free.fr/blog/?cat=5
► Voir aussi forums francophones Alfresco et Talend
► Quelques bonnes pratiques…
Premier pas
► Installer ETL Connector dans Alfresco (3 jars dans WEB-INF/lib)
► Designer un job Talend avec tAlfrescoOutput en flux sortant
► Y configurer l’adresse web du serveur Alfresco, mapper au minimum
la métadonnée cm:name, et exécuter !
10
ETL Connector et Talend - Démonstration
Démonstration : Import de quitus
Fonctionnalités démontrées
► Fichiers référencés et métadonnées décrites dans un fichier XML
► Génération de l’arborescence de classification
► Métadonnées métier (métamodèle spécifique)
► Propriétés multivaluées
Autres fonctionnalités
► Modes de mise à jour
► Positionnement des habilitations
► Associations : parent-enfant et relations…
Merci à Habitat 76 et Nicolas Feray pour le cas métier et le jeu de
tests !
11
ETL Connector – Architecture - 1
Alfresco
Server
Alfresco
Server
XML /
REST
Talend code
generation
XLS, RDBMS…
12
ETL Connector – Architecture - 2
Reprend l’architecture d’import ACP d’Alfresco et ajoute
► transactions sur l’import de chaque nœud,
► trace des erreurs,
► Identification par nom (et nom xpath),
► modes de mise à jour…
Interactions ETL – Alfresco en XML / REST
► XML : ACP (Alfresco Content Package) !
► Documents : référencés par des URLs (pointant sur le système de
fichier local, ou monté en réseau, ou HTTP…)
► Architecture : basée sur les Command d’Alfresco
« Bon citoyen » dans l’architecture globale
► reprise par Alfresco envisageable
13
Conclusion
L’import de documents :
► De la reprise de documents à l’ETL
► Une solution versatile : ETL Connector pour Alfresco et Talend
► Plus d’informations : http://forge.alfresco.com/projects/etlconnector
Au-delà…
► Open Wide pour vos intégrations Alfresco !
► Autres réalisations : interfaces web riches, collaboratif avancé,
processus métier, ERP (SAP), intégration de portail, d’applications
métier…
► Sessions de démonstrations
14
Contacts
14, Rue Gaillon
75002 Paris
Tél. : 01 42 68 28 00
Fax : 01 40 07 54 86
Merci de
votre
attention !
Contact
marc.dutoo@openwide.fr
www.openwide.fr
Questions –
réponses…

Contenu connexe

En vedette

Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelFrédéric FAURE
 
Restitution des données environnement Microsoft & data visualization : panel ...
Restitution des données environnement Microsoft & data visualization : panel ...Restitution des données environnement Microsoft & data visualization : panel ...
Restitution des données environnement Microsoft & data visualization : panel ...Microsoft
 
Pl News Letter Sept07
Pl News Letter Sept07Pl News Letter Sept07
Pl News Letter Sept07robertpluss
 
Génération de documents Office avec Open XML et VSTO
Génération de documents Office avec Open XML et VSTOGénération de documents Office avec Open XML et VSTO
Génération de documents Office avec Open XML et VSTOguested7f6
 
XML Avancé : DTD, XSD, XPATH, XSLT, XQuery
XML Avancé : DTD, XSD, XPATH, XSLT, XQueryXML Avancé : DTD, XSD, XPATH, XSLT, XQuery
XML Avancé : DTD, XSD, XPATH, XSLT, XQueryRachid NID SAID
 
Gestion des enregistrements et des archives avec Nuxeo
Gestion des enregistrements et des archives avec NuxeoGestion des enregistrements et des archives avec Nuxeo
Gestion des enregistrements et des archives avec NuxeoBenoit des Ligneris
 
Présentation Talend Open Studio
Présentation Talend Open StudioPrésentation Talend Open Studio
Présentation Talend Open Studiohoracio lassey
 
Présentation de alfresco - l'outil de GED open-source java
Présentation de alfresco - l'outil de GED open-source javaPrésentation de alfresco - l'outil de GED open-source java
Présentation de alfresco - l'outil de GED open-source javaFabien Baligand
 
Intro to Talend Open Studio for Data Integration
Intro to Talend Open Studio for Data IntegrationIntro to Talend Open Studio for Data Integration
Intro to Talend Open Studio for Data IntegrationPhilip Yurchuk
 
La gestion des archives avec Alfresco
La gestion des archives avec AlfrescoLa gestion des archives avec Alfresco
La gestion des archives avec AlfrescoSavoir-faire Linux
 
Webinar "La plateforme Alfresco"
Webinar "La plateforme Alfresco"Webinar "La plateforme Alfresco"
Webinar "La plateforme Alfresco"Michael Harlaut
 
Ged Open Source - Documation 2010
Ged Open Source - Documation 2010Ged Open Source - Documation 2010
Ged Open Source - Documation 2010Thomas Choppy
 
Webinar "Alfresco en une heure"
Webinar "Alfresco en une heure"Webinar "Alfresco en une heure"
Webinar "Alfresco en une heure"Michael Harlaut
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian Lilia Sfaxi
 

En vedette (20)

Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
 
Poster ETP Réseau PIC - V2
Poster ETP Réseau PIC - V2Poster ETP Réseau PIC - V2
Poster ETP Réseau PIC - V2
 
EAI
EAIEAI
EAI
 
Restitution des données environnement Microsoft & data visualization : panel ...
Restitution des données environnement Microsoft & data visualization : panel ...Restitution des données environnement Microsoft & data visualization : panel ...
Restitution des données environnement Microsoft & data visualization : panel ...
 
Pl News Letter Sept07
Pl News Letter Sept07Pl News Letter Sept07
Pl News Letter Sept07
 
Génération de documents Office avec Open XML et VSTO
Génération de documents Office avec Open XML et VSTOGénération de documents Office avec Open XML et VSTO
Génération de documents Office avec Open XML et VSTO
 
XML Avancé : DTD, XSD, XPATH, XSLT, XQuery
XML Avancé : DTD, XSD, XPATH, XSLT, XQueryXML Avancé : DTD, XSD, XPATH, XSLT, XQuery
XML Avancé : DTD, XSD, XPATH, XSLT, XQuery
 
Gestion des enregistrements et des archives avec Nuxeo
Gestion des enregistrements et des archives avec NuxeoGestion des enregistrements et des archives avec Nuxeo
Gestion des enregistrements et des archives avec Nuxeo
 
Pfe
PfePfe
Pfe
 
Présentation Talend Open Studio
Présentation Talend Open StudioPrésentation Talend Open Studio
Présentation Talend Open Studio
 
Projet Domurpic
Projet DomurpicProjet Domurpic
Projet Domurpic
 
Présentation de alfresco - l'outil de GED open-source java
Présentation de alfresco - l'outil de GED open-source javaPrésentation de alfresco - l'outil de GED open-source java
Présentation de alfresco - l'outil de GED open-source java
 
Intro to Talend Open Studio for Data Integration
Intro to Talend Open Studio for Data IntegrationIntro to Talend Open Studio for Data Integration
Intro to Talend Open Studio for Data Integration
 
Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?
 
La gestion des archives avec Alfresco
La gestion des archives avec AlfrescoLa gestion des archives avec Alfresco
La gestion des archives avec Alfresco
 
Webinar "La plateforme Alfresco"
Webinar "La plateforme Alfresco"Webinar "La plateforme Alfresco"
Webinar "La plateforme Alfresco"
 
Ged Open Source - Documation 2010
Ged Open Source - Documation 2010Ged Open Source - Documation 2010
Ged Open Source - Documation 2010
 
Livre blanc - GED les meilleures solutions open source
Livre blanc - GED les meilleures solutions open sourceLivre blanc - GED les meilleures solutions open source
Livre blanc - GED les meilleures solutions open source
 
Webinar "Alfresco en une heure"
Webinar "Alfresco en une heure"Webinar "Alfresco en une heure"
Webinar "Alfresco en une heure"
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian
 

Similaire à Alfresco Meetup - ETL Connector & Talend

atol_alfresco.pdf
atol_alfresco.pdfatol_alfresco.pdf
atol_alfresco.pdfatolcd
 
Présentation Sollan I-Expo 2008
Présentation Sollan I-Expo 2008Présentation Sollan I-Expo 2008
Présentation Sollan I-Expo 2008mlefebvre
 
Introduction au Domain Driven Design
Introduction au Domain Driven DesignIntroduction au Domain Driven Design
Introduction au Domain Driven DesignDNG Consulting
 
#NuxeoDay | Retour d'expérience équipementier mondial du ferroviaire
#NuxeoDay | Retour d'expérience équipementier mondial du ferroviaire#NuxeoDay | Retour d'expérience équipementier mondial du ferroviaire
#NuxeoDay | Retour d'expérience équipementier mondial du ferroviaireNuxeo
 
Webinar Alfresco/Smile - Novembre 2013
Webinar Alfresco/Smile - Novembre 2013Webinar Alfresco/Smile - Novembre 2013
Webinar Alfresco/Smile - Novembre 2013Smile I.T is open
 
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architecture
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architectureTartine - Pixelle, Refonte de l’ingestion et présentation de l’architecture
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architectureconfluent
 
Soirée SOA - 2010-06-15 - Présentation de l'ESB Petals
Soirée SOA - 2010-06-15 - Présentation de l'ESB PetalsSoirée SOA - 2010-06-15 - Présentation de l'ESB Petals
Soirée SOA - 2010-06-15 - Présentation de l'ESB PetalsNormandy JUG
 
Switch to alfresco with 1 genia fr
Switch to alfresco with 1 genia frSwitch to alfresco with 1 genia fr
Switch to alfresco with 1 genia frAlfresco Software
 
Microservices-DDD-Telosys-Devoxx-FR-2022
Microservices-DDD-Telosys-Devoxx-FR-2022Microservices-DDD-Telosys-Devoxx-FR-2022
Microservices-DDD-Telosys-Devoxx-FR-2022Laurent Guérin
 
Ux092 formation-mise-en-place-d-annuaire-ldap
Ux092 formation-mise-en-place-d-annuaire-ldapUx092 formation-mise-en-place-d-annuaire-ldap
Ux092 formation-mise-en-place-d-annuaire-ldapCERTyou Formation
 
2012 02-09-eranea-presentation-jug-lausanne
2012 02-09-eranea-presentation-jug-lausanne2012 02-09-eranea-presentation-jug-lausanne
2012 02-09-eranea-presentation-jug-lausanneDidier Durand
 
Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?pprem
 
Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]ANEO
 
IT Customer Solution Architect
IT Customer Solution ArchitectIT Customer Solution Architect
IT Customer Solution ArchitecticVatant
 
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataAzure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataMicrosoft
 
10 ans d’archivage numérique au CINES : premiers bilans et perspectives
10 ans d’archivage numérique au CINES : premiers bilans et perspectives10 ans d’archivage numérique au CINES : premiers bilans et perspectives
10 ans d’archivage numérique au CINES : premiers bilans et perspectivesAssociationAF
 
BreizhCamp - Drupal7 dans le cloud avec Azure
BreizhCamp - Drupal7 dans le cloud avec AzureBreizhCamp - Drupal7 dans le cloud avec Azure
BreizhCamp - Drupal7 dans le cloud avec AzureNicolas Georgeault
 

Similaire à Alfresco Meetup - ETL Connector & Talend (20)

atol_alfresco.pdf
atol_alfresco.pdfatol_alfresco.pdf
atol_alfresco.pdf
 
Présentation Sollan I-Expo 2008
Présentation Sollan I-Expo 2008Présentation Sollan I-Expo 2008
Présentation Sollan I-Expo 2008
 
Introduction au Domain Driven Design
Introduction au Domain Driven DesignIntroduction au Domain Driven Design
Introduction au Domain Driven Design
 
#NuxeoDay | Retour d'expérience équipementier mondial du ferroviaire
#NuxeoDay | Retour d'expérience équipementier mondial du ferroviaire#NuxeoDay | Retour d'expérience équipementier mondial du ferroviaire
#NuxeoDay | Retour d'expérience équipementier mondial du ferroviaire
 
Webinar Alfresco/Smile - Novembre 2013
Webinar Alfresco/Smile - Novembre 2013Webinar Alfresco/Smile - Novembre 2013
Webinar Alfresco/Smile - Novembre 2013
 
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architecture
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architectureTartine - Pixelle, Refonte de l’ingestion et présentation de l’architecture
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architecture
 
Soirée SOA - 2010-06-15 - Présentation de l'ESB Petals
Soirée SOA - 2010-06-15 - Présentation de l'ESB PetalsSoirée SOA - 2010-06-15 - Présentation de l'ESB Petals
Soirée SOA - 2010-06-15 - Présentation de l'ESB Petals
 
DeciLogic Report
DeciLogic ReportDeciLogic Report
DeciLogic Report
 
Switch to alfresco with 1 genia fr
Switch to alfresco with 1 genia frSwitch to alfresco with 1 genia fr
Switch to alfresco with 1 genia fr
 
Microservices-DDD-Telosys-Devoxx-FR-2022
Microservices-DDD-Telosys-Devoxx-FR-2022Microservices-DDD-Telosys-Devoxx-FR-2022
Microservices-DDD-Telosys-Devoxx-FR-2022
 
Ux092 formation-mise-en-place-d-annuaire-ldap
Ux092 formation-mise-en-place-d-annuaire-ldapUx092 formation-mise-en-place-d-annuaire-ldap
Ux092 formation-mise-en-place-d-annuaire-ldap
 
Notre offre GED / ECM / Capture
Notre offre GED / ECM / CaptureNotre offre GED / ECM / Capture
Notre offre GED / ECM / Capture
 
2012 02-09-eranea-presentation-jug-lausanne
2012 02-09-eranea-presentation-jug-lausanne2012 02-09-eranea-presentation-jug-lausanne
2012 02-09-eranea-presentation-jug-lausanne
 
Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?
 
Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
 
IT Customer Solution Architect
IT Customer Solution ArchitectIT Customer Solution Architect
IT Customer Solution Architect
 
MERAZKA Messaoud
MERAZKA MessaoudMERAZKA Messaoud
MERAZKA Messaoud
 
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataAzure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
 
10 ans d’archivage numérique au CINES : premiers bilans et perspectives
10 ans d’archivage numérique au CINES : premiers bilans et perspectives10 ans d’archivage numérique au CINES : premiers bilans et perspectives
10 ans d’archivage numérique au CINES : premiers bilans et perspectives
 
BreizhCamp - Drupal7 dans le cloud avec Azure
BreizhCamp - Drupal7 dans le cloud avec AzureBreizhCamp - Drupal7 dans le cloud avec Azure
BreizhCamp - Drupal7 dans le cloud avec Azure
 

Plus de Marc Dutoo

Bringing Entreprise Search in the Big Data era with PCU - Paris Open Source ...
 Bringing Entreprise Search in the Big Data era with PCU - Paris Open Source ... Bringing Entreprise Search in the Big Data era with PCU - Paris Open Source ...
Bringing Entreprise Search in the Big Data era with PCU - Paris Open Source ...Marc Dutoo
 
OCCIware @ Paris Open Source Summit 2017 - a standard, extensible Cloud consu...
OCCIware @ Paris Open Source Summit 2017 - a standard, extensible Cloud consu...OCCIware @ Paris Open Source Summit 2017 - a standard, extensible Cloud consu...
OCCIware @ Paris Open Source Summit 2017 - a standard, extensible Cloud consu...Marc Dutoo
 
Model and pilot all cloud layers with OCCIware - Eclipse Day Lyon 2017
Model and pilot all cloud layers with OCCIware - Eclipse Day Lyon 2017Model and pilot all cloud layers with OCCIware - Eclipse Day Lyon 2017
Model and pilot all cloud layers with OCCIware - Eclipse Day Lyon 2017Marc Dutoo
 
PCU@RISE 2017 - Building a thesaurus for product search
PCU@RISE 2017 - Building a thesaurus for product searchPCU@RISE 2017 - Building a thesaurus for product search
PCU@RISE 2017 - Building a thesaurus for product searchMarc Dutoo
 
OCCIware@CloudExpoLondon2017 - an extensible, standard XaaS Cloud consumer pl...
OCCIware@CloudExpoLondon2017 - an extensible, standard XaaS Cloud consumer pl...OCCIware@CloudExpoLondon2017 - an extensible, standard XaaS Cloud consumer pl...
OCCIware@CloudExpoLondon2017 - an extensible, standard XaaS Cloud consumer pl...Marc Dutoo
 
OCCIware@POSS 2016 - an extensible, standard XaaS cloud consumer platform
OCCIware@POSS 2016 - an extensible, standard XaaS cloud consumer platformOCCIware@POSS 2016 - an extensible, standard XaaS cloud consumer platform
OCCIware@POSS 2016 - an extensible, standard XaaS cloud consumer platformMarc Dutoo
 
OCCIware@OW2con 2016
OCCIware@OW2con 2016OCCIware@OW2con 2016
OCCIware@OW2con 2016Marc Dutoo
 
EclipseCon 2016 - OCCIware : one Cloud API to rule them all
EclipseCon 2016 - OCCIware : one Cloud API to rule them allEclipseCon 2016 - OCCIware : one Cloud API to rule them all
EclipseCon 2016 - OCCIware : one Cloud API to rule them allMarc Dutoo
 
OCCIware Cloud Expo London 2016 - Docker Studio, Studio Factory, erocci bus &...
OCCIware Cloud Expo London 2016 - Docker Studio, Studio Factory, erocci bus &...OCCIware Cloud Expo London 2016 - Docker Studio, Studio Factory, erocci bus &...
OCCIware Cloud Expo London 2016 - Docker Studio, Studio Factory, erocci bus &...Marc Dutoo
 
OCCIware @ Cloud Computing World 2016 - year 1 milestone & Linked Data demo
OCCIware @ Cloud Computing World 2016 - year 1 milestone & Linked Data demoOCCIware @ Cloud Computing World 2016 - year 1 milestone & Linked Data demo
OCCIware @ Cloud Computing World 2016 - year 1 milestone & Linked Data demoMarc Dutoo
 
OCCIware & Linked Data prototype OW2Con@POSS
OCCIware & Linked Data prototype OW2Con@POSSOCCIware & Linked Data prototype OW2Con@POSS
OCCIware & Linked Data prototype OW2Con@POSSMarc Dutoo
 
OCCIware - A Framework for Everything as a Service - Cloud Expo London 2015
OCCIware - A Framework for Everything as a Service - Cloud Expo London 2015OCCIware - A Framework for Everything as a Service - Cloud Expo London 2015
OCCIware - A Framework for Everything as a Service - Cloud Expo London 2015Marc Dutoo
 
EasySOA business case and real world use case 20130220
EasySOA business case and real world use case 20130220EasySOA business case and real world use case 20130220
EasySOA business case and real world use case 20130220Marc Dutoo
 
OW2Con2012 Scarbo2 SOA-Consistent BPM
OW2Con2012 Scarbo2 SOA-Consistent BPMOW2Con2012 Scarbo2 SOA-Consistent BPM
OW2Con2012 Scarbo2 SOA-Consistent BPMMarc Dutoo
 
EclipseConEurope2012 SOA - Models As Operational Documentation
EclipseConEurope2012 SOA - Models As Operational DocumentationEclipseConEurope2012 SOA - Models As Operational Documentation
EclipseConEurope2012 SOA - Models As Operational DocumentationMarc Dutoo
 
EclipseConEurope2012 SOA - Talend with EasySOA
EclipseConEurope2012 SOA - Talend with EasySOAEclipseConEurope2012 SOA - Talend with EasySOA
EclipseConEurope2012 SOA - Talend with EasySOAMarc Dutoo
 
Service Integration Goes Social - Solutions Linux 2012 (OW2 Track)
Service Integration Goes Social - Solutions Linux 2012 (OW2 Track)Service Integration Goes Social - Solutions Linux 2012 (OW2 Track)
Service Integration Goes Social - Solutions Linux 2012 (OW2 Track)Marc Dutoo
 
Scripts, Apps, APIs : les nouveaux champs de bataille de l'Open Source à l'èr...
Scripts, Apps, APIs : les nouveaux champs de bataille de l'Open Source à l'èr...Scripts, Apps, APIs : les nouveaux champs de bataille de l'Open Source à l'èr...
Scripts, Apps, APIs : les nouveaux champs de bataille de l'Open Source à l'èr...Marc Dutoo
 
From Eclipse to Document Management - Eclipse DemoCamp Grenoble 2012
From Eclipse to Document Management - Eclipse DemoCamp Grenoble 2012From Eclipse to Document Management - Eclipse DemoCamp Grenoble 2012
From Eclipse to Document Management - Eclipse DemoCamp Grenoble 2012Marc Dutoo
 
SOA facile en 10 pratiques avec EasySOA - Alpes JUG
SOA facile en 10 pratiques avec EasySOA - Alpes JUGSOA facile en 10 pratiques avec EasySOA - Alpes JUG
SOA facile en 10 pratiques avec EasySOA - Alpes JUGMarc Dutoo
 

Plus de Marc Dutoo (20)

Bringing Entreprise Search in the Big Data era with PCU - Paris Open Source ...
 Bringing Entreprise Search in the Big Data era with PCU - Paris Open Source ... Bringing Entreprise Search in the Big Data era with PCU - Paris Open Source ...
Bringing Entreprise Search in the Big Data era with PCU - Paris Open Source ...
 
OCCIware @ Paris Open Source Summit 2017 - a standard, extensible Cloud consu...
OCCIware @ Paris Open Source Summit 2017 - a standard, extensible Cloud consu...OCCIware @ Paris Open Source Summit 2017 - a standard, extensible Cloud consu...
OCCIware @ Paris Open Source Summit 2017 - a standard, extensible Cloud consu...
 
Model and pilot all cloud layers with OCCIware - Eclipse Day Lyon 2017
Model and pilot all cloud layers with OCCIware - Eclipse Day Lyon 2017Model and pilot all cloud layers with OCCIware - Eclipse Day Lyon 2017
Model and pilot all cloud layers with OCCIware - Eclipse Day Lyon 2017
 
PCU@RISE 2017 - Building a thesaurus for product search
PCU@RISE 2017 - Building a thesaurus for product searchPCU@RISE 2017 - Building a thesaurus for product search
PCU@RISE 2017 - Building a thesaurus for product search
 
OCCIware@CloudExpoLondon2017 - an extensible, standard XaaS Cloud consumer pl...
OCCIware@CloudExpoLondon2017 - an extensible, standard XaaS Cloud consumer pl...OCCIware@CloudExpoLondon2017 - an extensible, standard XaaS Cloud consumer pl...
OCCIware@CloudExpoLondon2017 - an extensible, standard XaaS Cloud consumer pl...
 
OCCIware@POSS 2016 - an extensible, standard XaaS cloud consumer platform
OCCIware@POSS 2016 - an extensible, standard XaaS cloud consumer platformOCCIware@POSS 2016 - an extensible, standard XaaS cloud consumer platform
OCCIware@POSS 2016 - an extensible, standard XaaS cloud consumer platform
 
OCCIware@OW2con 2016
OCCIware@OW2con 2016OCCIware@OW2con 2016
OCCIware@OW2con 2016
 
EclipseCon 2016 - OCCIware : one Cloud API to rule them all
EclipseCon 2016 - OCCIware : one Cloud API to rule them allEclipseCon 2016 - OCCIware : one Cloud API to rule them all
EclipseCon 2016 - OCCIware : one Cloud API to rule them all
 
OCCIware Cloud Expo London 2016 - Docker Studio, Studio Factory, erocci bus &...
OCCIware Cloud Expo London 2016 - Docker Studio, Studio Factory, erocci bus &...OCCIware Cloud Expo London 2016 - Docker Studio, Studio Factory, erocci bus &...
OCCIware Cloud Expo London 2016 - Docker Studio, Studio Factory, erocci bus &...
 
OCCIware @ Cloud Computing World 2016 - year 1 milestone & Linked Data demo
OCCIware @ Cloud Computing World 2016 - year 1 milestone & Linked Data demoOCCIware @ Cloud Computing World 2016 - year 1 milestone & Linked Data demo
OCCIware @ Cloud Computing World 2016 - year 1 milestone & Linked Data demo
 
OCCIware & Linked Data prototype OW2Con@POSS
OCCIware & Linked Data prototype OW2Con@POSSOCCIware & Linked Data prototype OW2Con@POSS
OCCIware & Linked Data prototype OW2Con@POSS
 
OCCIware - A Framework for Everything as a Service - Cloud Expo London 2015
OCCIware - A Framework for Everything as a Service - Cloud Expo London 2015OCCIware - A Framework for Everything as a Service - Cloud Expo London 2015
OCCIware - A Framework for Everything as a Service - Cloud Expo London 2015
 
EasySOA business case and real world use case 20130220
EasySOA business case and real world use case 20130220EasySOA business case and real world use case 20130220
EasySOA business case and real world use case 20130220
 
OW2Con2012 Scarbo2 SOA-Consistent BPM
OW2Con2012 Scarbo2 SOA-Consistent BPMOW2Con2012 Scarbo2 SOA-Consistent BPM
OW2Con2012 Scarbo2 SOA-Consistent BPM
 
EclipseConEurope2012 SOA - Models As Operational Documentation
EclipseConEurope2012 SOA - Models As Operational DocumentationEclipseConEurope2012 SOA - Models As Operational Documentation
EclipseConEurope2012 SOA - Models As Operational Documentation
 
EclipseConEurope2012 SOA - Talend with EasySOA
EclipseConEurope2012 SOA - Talend with EasySOAEclipseConEurope2012 SOA - Talend with EasySOA
EclipseConEurope2012 SOA - Talend with EasySOA
 
Service Integration Goes Social - Solutions Linux 2012 (OW2 Track)
Service Integration Goes Social - Solutions Linux 2012 (OW2 Track)Service Integration Goes Social - Solutions Linux 2012 (OW2 Track)
Service Integration Goes Social - Solutions Linux 2012 (OW2 Track)
 
Scripts, Apps, APIs : les nouveaux champs de bataille de l'Open Source à l'èr...
Scripts, Apps, APIs : les nouveaux champs de bataille de l'Open Source à l'èr...Scripts, Apps, APIs : les nouveaux champs de bataille de l'Open Source à l'èr...
Scripts, Apps, APIs : les nouveaux champs de bataille de l'Open Source à l'èr...
 
From Eclipse to Document Management - Eclipse DemoCamp Grenoble 2012
From Eclipse to Document Management - Eclipse DemoCamp Grenoble 2012From Eclipse to Document Management - Eclipse DemoCamp Grenoble 2012
From Eclipse to Document Management - Eclipse DemoCamp Grenoble 2012
 
SOA facile en 10 pratiques avec EasySOA - Alpes JUG
SOA facile en 10 pratiques avec EasySOA - Alpes JUGSOA facile en 10 pratiques avec EasySOA - Alpes JUG
SOA facile en 10 pratiques avec EasySOA - Alpes JUG
 

Alfresco Meetup - ETL Connector & Talend

  • 1. Migration et import de données Avec Alfresco et l’ETL Talend Marc Dutoo - Alfresco Meetup - 30 Avril 2009
  • 2. 2 Agenda Qui sommes-nous ? Problématiques de l’import de données La réponse ETL Connector & Talend Architecture Démonstration Questions
  • 3. 3 Qui sommes-nous ? Open Wide – architecte Open Source ~ 90 employés sur Paris et Lyon, spin off de Thalès Portail, gestion documentaire, Business Intelligence… Offre de services pour les logiciels libres couvrant tout le cycle ► Industrialisation de l’usage des composants Open Source, pour les grands comptes et les administrations Marc Dutoo – architecte GED / SOA / BPM Conseil, formations, projets Responsable R&D (Eclipse JWT, OW2 Scarbo…)
  • 4. 4 Open Wide et Alfresco Partenaire Gold depuis plus de 3 ans L’assurance de la qualité L’assurance de l’engagement de l’éditeur à nos côtés De nombreux projets réalisés et en production Une expertise de haut niveau de l’intégration et de la solution
  • 5. 5 Problématique Pour pouvoir gérer des documents, il faut qu’ils soient dans Alfresco ! Une entreprise a toujours des documents antérieurs à l’introduction Alfresco ► Ne serait-ce qu’un dossier partagé en réseau Et en sus des documents, souvent une organisation, une classification, voire des métadonnées métier ► Fichiers d’index ► Fichiers de métadonnées scannés (dématérialisation) ► Métier : wiki, base de données, application… NB. On écarte la migration de version ☺
  • 6. 6 Cas d’usage 1 – Flexibilité et simplicité « Peu » de documents et de méta-informations, classification antérieure non formalisée, besoin ponctuel Exemple : KM et Intranet de collectivités locales Solution : Flexibilité et simplicité Action automatique avalant un fichier index ► Les documents sont déposés dans Alfresco dans un espace technique ► Puis un index global les référence et fournit classification et métadonnées Architecture ► Action abstraite à étendre avec le code de classification métier ► Autorise toute opération lors de la classification Adapté au partage de connaissances…
  • 7. 7 Cas d’usage 2 – Performance Nombreux documents, import récurrent, classification formalisée Exemple : Miauton (CH, Bâtiment, 5000 factures / jour) Solution : performance et évolutivité Import automatique des documents déposés dans un dossier sur le système de fichier, chacun avec son fichier de métadonnées Architecture ► Polling threadé ► Index : optimisation, amélioration du volume (avec Alfresco) ► Evolutif : autres documents métier, scanner / OCR (Kofax, Readsoft…) Adapté à la dématérialisation !
  • 8. 8 Cas d’usage 3 – Versatilité Beaucoup de documents, de métadonnées, plan de classement établi, récurrence… Flexibilité, mais pas de passer du temps sur du code jetable ! Exemple : Habitat 76 Solution : versatilité Intégration d’outillage ETL (Extract, Transform, Load) ► Principe de l’ETL : introspection des données (fichier, base…) et design de leurs flux d’intégration (« jobs ») Réalisation : ETLConnector pour Talend ► En contribution sur la forge Alfresco (projet etlconnector) ► Talend : ETL Open Source, leader mondial, basé sur Eclipse, français
  • 9. 9 ETL Connector – Présentation Projet en collaboration ► entre Habitat 76 (besoin et fonctionnel), Open Wide (conception et développement), Talend (support) L’utiliser ► Fourni avec Talend 3.1RC3 ► Validé avec Alfresco 2.1 et 2.9b, erreurs mineurs en 3 Stable ► Tutorial : http://nicolas.feray.free.fr/blog/?cat=5 ► Voir aussi forums francophones Alfresco et Talend ► Quelques bonnes pratiques… Premier pas ► Installer ETL Connector dans Alfresco (3 jars dans WEB-INF/lib) ► Designer un job Talend avec tAlfrescoOutput en flux sortant ► Y configurer l’adresse web du serveur Alfresco, mapper au minimum la métadonnée cm:name, et exécuter !
  • 10. 10 ETL Connector et Talend - Démonstration Démonstration : Import de quitus Fonctionnalités démontrées ► Fichiers référencés et métadonnées décrites dans un fichier XML ► Génération de l’arborescence de classification ► Métadonnées métier (métamodèle spécifique) ► Propriétés multivaluées Autres fonctionnalités ► Modes de mise à jour ► Positionnement des habilitations ► Associations : parent-enfant et relations… Merci à Habitat 76 et Nicolas Feray pour le cas métier et le jeu de tests !
  • 11. 11 ETL Connector – Architecture - 1 Alfresco Server Alfresco Server XML / REST Talend code generation XLS, RDBMS…
  • 12. 12 ETL Connector – Architecture - 2 Reprend l’architecture d’import ACP d’Alfresco et ajoute ► transactions sur l’import de chaque nœud, ► trace des erreurs, ► Identification par nom (et nom xpath), ► modes de mise à jour… Interactions ETL – Alfresco en XML / REST ► XML : ACP (Alfresco Content Package) ! ► Documents : référencés par des URLs (pointant sur le système de fichier local, ou monté en réseau, ou HTTP…) ► Architecture : basée sur les Command d’Alfresco « Bon citoyen » dans l’architecture globale ► reprise par Alfresco envisageable
  • 13. 13 Conclusion L’import de documents : ► De la reprise de documents à l’ETL ► Une solution versatile : ETL Connector pour Alfresco et Talend ► Plus d’informations : http://forge.alfresco.com/projects/etlconnector Au-delà… ► Open Wide pour vos intégrations Alfresco ! ► Autres réalisations : interfaces web riches, collaboratif avancé, processus métier, ERP (SAP), intégration de portail, d’applications métier… ► Sessions de démonstrations
  • 14. 14 Contacts 14, Rue Gaillon 75002 Paris Tél. : 01 42 68 28 00 Fax : 01 40 07 54 86 Merci de votre attention ! Contact marc.dutoo@openwide.fr www.openwide.fr Questions – réponses…