Contenu connexe Similaire à Open LInked Data @ information.dk (Open Bergen) (15) Open LInked Data @ information.dk (Open Bergen)6. Dagsorden
• Information & jeg
• Baggrund
• Auto-tagging
7. Dagsorden
• Information & jeg
• Baggrund
• Auto-tagging
• Open Linked Data
8. Dagsorden
• Information & jeg
• Baggrund
• Auto-tagging
• Open Linked Data
• Fremtiden
11. about=”#me”
• Webudvikler på Information.dk - med @naxoc
• Udvikling og konsulentydelser (Drupal, Linkeddata)
12. about=”#me”
• Webudvikler på Information.dk - med @naxoc
• Udvikling og konsulentydelser (Drupal, Linkeddata)
• @johsw
13. about=”#me”
• Webudvikler på Information.dk - med @naxoc
• Udvikling og konsulentydelser (Drupal, Linkeddata)
• @johsw
• http://dk.linkedin.com/in/johanneswehner
14. about=”#me”
• Webudvikler på Information.dk - med @naxoc
• Udvikling og konsulentydelser (Drupal, Linkeddata)
• @johsw
• http://dk.linkedin.com/in/johanneswehner
• BA sprog og kommunikation
15. about=”#me”
• Webudvikler på Information.dk - med @naxoc
• Udvikling og konsulentydelser (Drupal, Linkeddata)
• @johsw
• http://dk.linkedin.com/in/johanneswehner
• BA sprog og kommunikation
• Master IT - IT-universitetet i København
19. Dagbladet Information
• Dagblad (mandag-lørdag)
• Født som illegalt nyhedsbrev under 2. verdenskrig
• Avis fra 1945
20. Dagbladet Information
• Dagblad (mandag-lørdag)
• Født som illegalt nyhedsbrev under 2. verdenskrig
• Avis fra 1945
• ca. 22.000 abonnenter
23. Information.dk
• Online siden 1997 (Drupal siden 2007)
• 217.000 indholdsider
24. Information.dk
• Online siden 1997 (Drupal siden 2007)
• 217.000 indholdsider
• 22.500 registerede brugere
25. Information.dk
• Online siden 1997 (Drupal siden 2007)
• 217.000 indholdsider
• 22.500 registerede brugere
• 54 i Denmark (Baseret på brugere - FDIM.dk)
26. Information.dk
• Online siden 1997 (Drupal siden 2007)
• 217.000 indholdsider
• 22.500 registerede brugere
• 54 i Denmark (Baseret på brugere - FDIM.dk)
• 184.000 brugere per måned
27. Information.dk
• Online siden 1997 (Drupal siden 2007)
• 217.000 indholdsider
• 22.500 registerede brugere
• 54 i Denmark (Baseret på brugere - FDIM.dk)
• 184.000 brugere per måned
• 2.000.000 pageviews per måned
44. • Personer - historisk, nulevende, faktiske og fiktive (22.500)
45. • Steder - subkontinenter, lande, byer, bydele (1.700)
46. • Organisationer - bands, ngo’er, firmaer... (3.200)
47. • Emner - “Terror”, “Globalisering”, “Heavy Rock” (2.000)
50. Fordele
• Forskelligt indhold til forskellige taksonomier
51. Fordele
• Forskelligt indhold til forskellige taksonomier
• Relaterede organisationer, steder og folk
52. Fordele
• Forskelligt indhold til forskellige taksonomier
• Relaterede organisationer, steder og folk
• Semantiske url’er
55. Udfordringer
• Er Sonic Youth en organisation?
• Hierarkisk helvede
56. Udfordringer
• Er Sonic Youth en organisation?
• Hierarkisk helvede
• Er en begivenhed et emne?
59. Løsninger
• Dræbe hierakiet - tilføje metadata
• Flere kategorier?
60. Løsninger
• Dræbe hierakiet - tilføje metadata
• Flere kategorier?
• Omgøre verden og/eller sproget så det passer til
kategorierne :-)
65. Autotagging
• Historisk indhold
• Forslag til eget indhold
• Syndikeret indhold - telegrammer
69. Metode
• Ingen NLP eller POS-tagging
70. Metode
• Ingen NLP eller POS-tagging
• Bare sandsynlige kandidater
71. Metode
• Ingen NLP eller POS-tagging
• Bare sandsynlige kandidater
• ... og en masse sql-kald
75. Issues
• Flertydighed
• Kashmir
• Paris
76. Issues
• Flertydighed
• Kashmir
• Paris
• Venstre
77. Issues
• Flertydighed
• Kashmir
• Paris
• Venstre
• ....og relevans: Freetext vs. Tags
87. Flere URIs
• http://en.wikipedia.org/wiki/Bergen
• http://da.wikipedia.org/wiki/Bergen
• http://data.nytimes.com/N38434701847284882391
• http://sws.geonames.org/3161732/
88. Men hvorfor?
• Links til flere informationer
• Indhente tekst, data, billeder og video
• Bruge eksterne data til at berige og filtrere eget
indhold
• Og meget mere...
93. Næste trin
• Få entydige url’er selv
• Få flere eksterne data
94. Næste trin
• Få entydige url’er selv
• Få flere eksterne data
• Forbedre autotagger
95. Næste trin
• Få entydige url’er selv
• Få flere eksterne data
• Forbedre autotagger
• Relevans
96. Næste trin
• Få entydige url’er selv
• Få flere eksterne data
• Forbedre autotagger
• Relevans
• Flertydighed
97. Næste trin
• Få entydige url’er selv
• Få flere eksterne data
• Forbedre autotagger
• Relevans
• Flertydighed
• Lave en webservice?