Pour nourrir leur stratégie marketing et leur veille concurrentielle, les entreprises doivent surveiller le Web et donner un sens à cette grande quantité d'informations. Cette information est éparpillée et nécessite beaucoup de temps pour analyser les différentes sources et compiler les connaissances recueillies de manière intelligente. SMILK est un laboratoire commun entre l'Institut de recherche Inria et la société VISEO pour étudier le couplage fort d'algorithmes et de modèles linguistiques au niveau sémantique, l'extraction et le liage de connaissances issues des ressources du Web et la combinaison de différentes techniques de raisonnement (inférences logiques, des approximations et similitude, etc.). Dans ce contexte, nous allons présenter un prototype permettant d'enrichir les connaissances des utilisateurs naviguant sur le Web à l'aide de résultats issus du Traitement Automatique du Langage Naturel, du Web de Données et des réseaux sociaux. Notre présentation se concentrera sur la démonstration d'un plugin de navigateur facile à installer et à utiliser, qui permet d’enrichir l’expérience utilisateur avec quatre fonctions : - la démo commence par montrer comment il est possible d'identifier dans une page les entités pertinentes selon les intérêts de l'utilisateur et comment structurer les données connexes à l'aide d'une analyse linguistique dédiée ; - la deuxième partie de la démo montre comment nous lions les entités reconnues dans le texte ; - la troisième étape de la démo traite du liage d’entités pour connecter les données figurant dans le texte avec les données obtenues à partir de bases de connaissances du Web ; - enfin, dans une dernière étape la démo montre l’intégration de connaissances issues des médias sociaux pour fournir aux utilisateurs des opinions et les idées clés liées au sujet exploré. Le prototype que nous présenterons intègre entièrement les quatre fonctions précédemment définies et, dans le cadre de cette démonstration, est appliqué au domaine des cosmétiques.
Auteurs : Elena Cabrio, Jordan Calvi, Fabien Gandon, Cédric Lopez, Farhad Nooralahzadeh, Thibault Parmentier, Frédérique Segond Laboratoire Commun SMILK, Inria, VISEO
Remerciements : ces travaux de R&D et transfert sont soutenus par l’ANR au travers du laboratoire commun SMILK ANR-13-LAB2-0001-01
Russian Call girls in Dubai +971563133746 Dubai Call girls
Plugin smilk : données liées et traitement de la langue pour améliorer la navigation web
1. Plugin SMILK
données liées et traitement de la langue pour plus
d'intelligence dans la navigation sur le Web
Elena Cabrio, Jordan Calvi, Fabien Gandon,
Cédric Lopez, Farhad Nooralahzadeh,
Thibault Parmentier, Frédérique Segond
2. Plan of the Talk
(1) Overall view of the goals of SMILK Joint Lab
• Objective
• Framework and Technology
(2) Guided tour of the SMILK Plugin (1st Prototype)
augmented
browsing with
NLP & LOD
4. SMILK
Joint Laboratory between INRIA & VISEO (ANR)
[2014 - 2017]
Objectives:
To obtain unambiguous and non-
redundant information from the web, in
order to establish correlations between
the concepts and identify new links
5. Leveraging data
From extraction to enrichment
Raw
Data
Knowledge
Being able to analyze textual data in
order to extract meaning,
Identify links between data in order to
discover more information
Enriching information with data
from the Web without creating
ambiguity or redundancy
1
2
3
6. At the border of NLP and Semantic Web
How to extract the
semantics contained in raw
texts?
How to link such data?
How to navigate through this data?
How to structure the
semantics contained in
raw text?
How to disambiguate
data using the LOD ?
7. ‹N°›
REcognition of Named entity in COsmetic
(RENCO)
Objective : To extract entities of interest in the Cosmetic domain
Rule-based system (+ learning) whose specifications were
developed consequently by studying over a corpus of
French journalistic articles (Beauté Info, Cosmétique
Mag, …)
➢ Definitional rules: Hyponymy and Hypernymy relations + context
➢ Hierarchical rules: based on the hierarchy of entity
types (schema) and enables the building of an
ontological resource
Ex(FR): Les marques telles que Lancôme et Guerlain; Le groupe L’Oréal
Ex(EN): Brands such as Lancôme and Guerlain; L’Oréal group
Ex(FR): La petite robe noire de Guerlain(LVMH)
8. ‹N°›
REcognition of Named entity in COsmetic
(RENCO)
➢ Coordination rules: use the coordination (« et », « ou », punctuation…)
➢ Intern rules: use the internal context of an entity
➢ Semantic rules: use verbs for the identification of a subject
and/or complement
Lopez et al. Generating a Resource for Products and Brand Names Recognition.
Application to the Cosmetic Domain (LREC'14).
Ex(FR): Yves Rocher, Diptyque et Diesel
Ex(EN): Yves Rocher, Diptyque and Diesel
Ex(FR): L’Oréal Grand Public
Ex(FR): Vichy lance Dercos Neogenic
Ex(EN): Vichy introduces Dercos Neogenic
11. Use case
Product and brand names recognition
Brand
name
0 Recognizing entities using their context
La marque Claremont & May a lancé sa crème extra-fluide Sun Light actif
Brand name Product Name
« actif » is included in the entity
1
1
2
3
4
5
6
12. Use case
Finding information about brand names
Brand
name
1 Operating a public knowledge base :
Open Data (linking)
0 Recognizing entities using their context.
Dbpedia:
3,4 millions of entries:
• Persons
• Locations
• Music albums
• Video games
• Diseases
• etc.
13. SMILK
Use case
Finding information about brand names
Brand
name
1
2
Operating a public knowledge base :
Open Data
Constructing a private knowledge base
dedicated to the domain and enriched
while browsing
0 Recognizing entities using their context.
Product
Range
Brand name
Division
Group Ex: L’Oréal
Ex: L’Oréal Produits Grand Public
Ex: L’Oréal Paris
Ex: Revitalift Laser X3
Ex: Revitalift
The Bio-Buste Suractive cream.
La petite robe noire by Guerlain (LVMH)
Yves Rocher, Diptyque et Diesel
L’Oréal Grand Public
Vichy launches Dercos Neogenic
RENCO
14. Use case
•Finding information about brand names
Brand
name
Conceptsassociated
Opinions
Parfum
Gel douche
Contour des yeux
Teint Prix
Regard
1
2
3
Operating a public knowledge base :
Open Data
Constructing a private knowledge base
dedicated to the domain and enriched
while browsing
Analyzing messages from Social Media.
0 Recognizing entities using their context.
18. SMILK
Step 4 – Accessing new sources and pursue the browsing
19. Our final goal is to …
19
•Extract and structure knowledge automatically
•Create links that make sense between data
•Integrate knowledge from different domains
•Share knowledge
•Reason on knowledge
•Generate knowledge
… to support Business Intelligence