Ettekanne 18. septembri avaandmete seminaril. Sisuks praktiline lähenemine avaandmetele. Mis on avaandmed, kuidas neist mõelda ning milline on nende mõju organisatsioonile. Samuti lühike kokkuvõte avaandmetega seotud riskidest
2. Praktiline mõtlemine, mitte retseptid
!
!
Parimad tehnilised lahendused muutuvad
kiiresti ja sõltuvad palju konkreetsest
probleemist
3. Täna kavas
" Miks avaandmed ja miks mitte?
" Kuidas mõelda avaandmetest organisatsiooni
kontekstis?
" Avaandmete ärilised probleemid
" Avaandmete riskid
" Tehnilised küsimused
5. Avaandmed on avalikult, ilma
finantskohustusi võtmata, kätte saadavad
andmed
!
!
Päris avatud andmeid ei ole, finantsbarjääri
valik definitsiooniks on kunstlik
6. Miks avaandmed?
" Innovatsioon
" Platvormistrateegia
" Andmete ja taristuga tegelemine on ärimudel
" Juriidilised põhjused
" Seadusandlus kuid ka litsentsitingimused ja lepingud
" Organisatsioonikultuur
" Nii selle manifestatsioon kui muutmise vahend
" Lõppkasutaja soov
" Avalikussuhted, korporatiivne vastutus
7. Miks mitte avaandmed?
" Kõrge alternatiivkulu
" Võrreldes muude omaniku hüve suurendamise viisidega
" Organisatsioonikultuur
" Juriidilised põhjused
" Seadusandlus kuid ka litsentsitingimused ja lepingud
" Organisatsiooniline inerts
" Suured organisatsioonid muutuvad aeglaselt
" Riskid ja kohustused ei kaalu üles hüve
8. Avaandmed ja organisatsioon
!
!
Avaandmed ei ole vaid tehniline probleem,
nad puudutavad organisatsiooni eri tahke
10. Organisatsiooni struktuur
Äri ja juriidika
Organisatsioon ja protsessid
Funktsionaalsed komponendid
Tehnilised lahendused
11. Avaandmeid ümbritsevad jõud
Organisatsiooni
soovid
Turu vajadus
Organisatsiooni
võimekus ja
piirangud
Ava-andmed
12. Organisatsiooni kui terviku võimekus
" Kolm kirjeldatud jõudu toimivad kõigil tasandeil
" Organisatsioonil võib olla äriline soov andmeid avada
kuid seda soovi võib piirata tehniline võimekus
" Organisatsiooni võimekus on summa tema
võimekusest igal tasandil
" On oluline hinnata, kas eesmärgi saavutamine
on reaalne
" Kui ei, tuleb leida viisid võimekuse kasvatamiseks või
muuta eesmärki
14. Avaandmed on vitamiin, mitte valuvaigisti
!
!
Tehnilises mõttes on tegu
madala signaali-müra suhtega
15. Võimekus ja vajadus on nagu kana ja muna
!
!
Me ei tea, mida me vajame, kuni me ei tea,
mis teil on. Me ei saa teile kõike näidata,
öelge, mida teil vaja on
16. Kolm avaandmete probleemi
" Avaandmed on ettevõttele pikaajaline kohustus
" Eriti linkandmete korral
" Uued sõltuvused arenduses
" Me ei saa muuta andmestruktuure ja äriloogikat
arvestamata avaandmete kasutajatega
" Iga muutus meie süsteemis võib tähendada muutust
andmete kasutajate süsteemides
" Uued sõltuvused halduses
" Tehes andmed kättesaadavaks lubame, et need on
kättesaadavad ka tulevikus
17. Kolm viisi andmeid avada
" Varjatud
" Iga internetis olev andmeühik on sisult avalikult
kasutatavad andmed
" Tavalised avaandmed
" Avalikud, dokumenteeritud ja stabiilse struktuuri ning
semantikaga andmed
" Rohelise Raamatu subjekt
" Piiratud avaandmed
" Andmed on avalikud ja tasuta, kuid kasutamiseks
eeldatakse teatud barjääride ületamist (Google mudel)
18. Varjatud avaandmed
" Kogu avalik info on masinloetav
" Ja seda ka kasutatakse
" Nii teie kahjuks kui kasuks
" Kasutusega ei ole mõistlik tehniliselt võidelda
" Teise poole ressursid on liiga suured
" Tuleb toetuda millelegi muule (näiteks juriidika)
" Vähegi tõsise huvi korral liikuge klassikalistele
avaandmetele
19. Tavapärased avaandmed
" Info on selgesõnaliselt kättesaadavaks tehtud
" Koos põhjaliku dokumentatsiooniga
" Oluline on stabiilne struktuur
" Semantika on oluline
" Mida tähendab tühi väli?
" Mida kirjutatakse välismaalase isikukoodi väljale?
" Kasu saamine eeldab suhtlust
" Soovitavalt kahepoolset
" “Meie server ei ole pühapäeval kättesaadav”
" “Mida tähendab tühi isikukoodiväli?”
20. Piiratud avaandmed
" Andmed on avalikud, kuid juurdepääsul on
kunstlikud barjäärid
" Näiteks vajadus registreeruda
" Juurdepääsul on alati piirangud
" Kasvõi kasutatav tehnoloogia aga ka info teenuse
olemasolust
" Kasulik andmete pakkujale
" Saab kehtestada ja jõustada kasutustingimusi
" Tekib konkreetne kasutajate kogukond
22. Isikuandmete kaitse
" Isikuandmeid ei saa päriselt puhastada
" Täielikult isikuandmetest puhastatud info on ka
täielikult kasutu (matemaatika!)
" Alati on küsimus mõistlikus riskis
" Eesti väiksuse probleem
" Kui keskmistatakse ühte inimest, siis ei ole privaatsus
tagatud
" Triangulatsiooni probleem
" Andmeid võib teiste allikate abil uuesti isikustada
23. Operatiivsed riskid
" Piiranguteta avalikke andmeid ka kasutatakse
piiranguteta
" Kui tihti ja kui palju andmeid küsitakse, ei ole teada
" Eriti ebameeldivad on järsk kasv koormuses
" Oluline on monitooring
" Eesmärgiks teiste klientide kaitsmine üksiku valesti
käituva kliendi eest
" Kuidas eristada pahatahtlikkust rumalusest?
" Kuidas seejärel pahatahtlik agent andmetest eemal
hoida?
24. Andmeriskid
" Allika mürgitamine
" Ründaja muudab pakutavaid andmeid talle sobival viisil
" Tuvastamine keeruline, mõju potentsiaalselt suur
" Konkurendi telefoninumbri asendamine enda omaga
avalikus andmestikus, näiteks
" Semantika riskid
" Pakutav andmestik on tollides ja kasutaja eeldab
millimeetreid
25. Null-kasutuse risk
" Kuup on n-mõõtmeline agregatsioon andmetelt
" Oluline andmete puhastamise ning analüütika vahend
" Exceli pivot table ainult et suur
" Lihtne määratleda, kallis arvutada
" Kuup on lõplik
" Kuubist saab ainult need koondid, mis on sinna sisse
kirjutatud
" Isegi väike eksimus kuubi definitsioonis võib
andmed lõppkasutajale kasutuks muuta
27. Kuidas andmetele ligi saab?
!
!
Väga olulise mõjuga valik nii lahenduse
kulu kui võimaliku kasutatavuse osas
28. Andmetõmmis
" Andmed eraldatakse operatiivsüsteemist ja
tehakse kättesaadavaks
" Tõmmis on staatiline ning saadaval vaid tervikuna
" Rohelises Raamatus soovitatud meetod
" Eeldatakse andmete vananemiskindlust
" Tõmmise ei muutu uuendamiste vahel
" Kasulik ja lihtne pakkujale
" Madal riskitase
" Andmete eraldamise/puhastamise loogika võib olla kui
tahes keeruline
29. Ligipääs andmetele
" Juurdepääs andmetele läbi selge liidese
" Sisuliselt avalik juurdepääs operatiivsüsteemile
" Rohkem liikuvaid osi
" Lisaks andmete struktuurile ja semantikale tuleb hallata
ka liidese struktuuri ja semantikat
" Liides on programm ja sellisena vajab hoolt
" Potentsiaalselt lihtne kasutajale
" Andmeid võib kasutada otse, ilma vahepealse
töötlemiseta
" Kas avatakse andmed või info?
30. Ligipääs teenustele
" Juurdepääs andmetele läbi äriloogika
" Eelmisele sarnane, kuid lisaks andmetele pakutakse ka
äriloogikat
" Näiteks aadressi kontrollimine korrektsete aadresside
andmestiku asemel
" Veel rohkem liikuvaid osi
" Lisaks muule tuleb hallata ka äriloogikat
" Potentsiaalselt lihtne kasutajale
" Juhul, kui andmete kasutamiseks vajalik äriloogika on
kas keeruline või tundlik
31. Ligipääs dokumentidele
" Andmete asemel juurdepääs dokumentidele
" Dokumendi moodustab komplekt omavahel seotud
andmeid
" Võlgnevuse puudumise tõend vs. võlgnevuste tabel vs.
teenus “kas võib osaleda hankes”
" Tavaliselt kasutusel, kui tulemust peab lugema
inimene
" Kasulik, keerulise andmestruktuuri puhul
" Ning selle üksikuid osi ei kasutata tavaliselt eraldi
33. RDF/XML
" RDF - Resource Description Framework
" Standardne vahend andmete struktuuri kirjeldamiseks
" Võimaldab esitada väiteid asjade kohta
" Võib olla väljendatud mitmel eri viisil, sealhulgas XML
" XML
" Küllalt raskepärane viis struktureeritud viisil andmeid
edastada
" Võib olla range struktuuriga kuid ei pruugi
" Kasuta neid keerulistel juhtudel: palju keerulise
struktuuriga andmeid
34. REST/JSON
" REST
" Teenused ja andmeelemendid on viidatud
veebiaadressidega
" Andmeelementidega saab manipuleerida veebi tuumaks
olevate protokollidega
" JSON
" Veebis levinud viis andmeid esitada, kasutatav otse
brauserist
" Ei oma jäika struktuuri
" Kasuta lihtsate kiirete lahenduste tarbeks