SlideShare une entreprise Scribd logo
1  sur  77
Télécharger pour lire hors ligne
Kunstig intelligens
Perspektiver for sundhedssektoren
Dagens program
• 14:00 Velkommen og et par ord om kunstig intelligens
• 14:20 Introduktion til maskinlæring
• 15:00 LEGO-demonstration – ”Will it break”?
• 15:30 Forfriskning og pause
• 16:00 Maskinlæring i sundhedssektoren
• 16:45 Afrunding og opsummering
• 17:00 Spørgsmål og svar
2
3
Velkommen
4
Det er ønsket om at gøre danskerne til
det sundeste folk i verden, der er
drivkraften bag Enversion.
Læs mere på enversion.dk eller følg os på Facebook, LinkedIn, Twitter
5
FOKUS
6
7
Data mining
Prædiktiv modellering
Maskinlæring
Data science
Big data
Kunstig intelligens
Maskinintelligens
Ekspertsystem
8
9
http://www.knightscope.com/
10
https://www.youtube.com/watch?v=WFR3lOm_xhE
11
Enorme datamængder Begrænset baggrundsviden
Genial til specialopgaver Multikunstner
Intet ”hvorfor” Holdninger, fantasi, etik, moral
Sandsynligheder Intuition
Ingen dårlige dage Performance afhænger af dagsform
12
http://content.time.com/time/magazine/article/0,9171,2048299,00.html
2015
13
14
http://aiimpacts.org/trends-in-the-cost-of-computing/
15
Introduktion til maskinlæring
16
17
18
RESULTAT
Kendte data
Blodprøvesvar
Køn, alder, herkomst
…
Kendte svar
Haft tarmkræft?
Træning
Anvendelse
Kendte data
Blodprøvesvar
Køn, alder, herkomst
…
Ønsket svar
Tarmkræft?
19
Attributter:
Eksisterende data,
der beskriver
objektets
forskellige
egenskaber.
(features)
Objektet:
Et eller andet,
man gerne vil
kunne udtale sig
om, f.eks.:
En borger
Et modermærke
Nogle symptomer
En spillefilm
En LEGO-klods
En kunde
Et journalopslag
En fakturalinje
…
RESULTAT
Gruppering:
Tilhørsforhold til andre
objekter.
Anormalitetsdetektion:
Afvigere (fra andre
normale objekter).
Klassifikation:
Ønsket viden
Kan ”puttes i kasser”.
Regression:
Ønsket viden
Kan tælles.
20
Attributter:
Blodprøvesvar
Symptomer
Journalnotater
Mobiltelefonbrug
Google-søgninger
Rejsevaner
Netflix-præferencer
Kreditkortbrug
Hvilepuls og BMI
Diagnoser
Køn, alder, civilstand
Lønindkomst
KOMPLEKSEATTRIBUTTER
RESULTAT
Gruppering:
Hvem minder han om?
Anormalitetsdetektion:
Er han et menneske?
Klassifikation:
Social bedrager?
Kræftsyg?
Dårlig betaler?
Vinelsker?
Regression:
Forventet levealder?
Livsløn?
Risiko% for diabetes?
21
Attributter:
Vægt
Dimensioner
Massefylde
Antal bøjelige led
Farve(r)
Antal enkeltdele
Produktionsår
Serienavn
Antal fikspunkter
Pigment(er)
Hårdhed
#solgte enheder
SIMPLEATTRIBUTTER
RESULTAT
Gruppering:
Klodstype?
Anormalitetsdetektion:
Er det en LEGO-klods?
Klassifikation:
Er den populær?
Er den skrøbelig?
Vil den flyde på vand?
Er den farlig for børn?
Regression:
Brugtpris?
Reklamationsrate?
Maksimal stablingshøjde?
22
23
Attributter:
Blodprøvesvar
Symptomer
Journalnotater
Mobiltelefonbrug
Google-søgninger
Rejsevaner
Netflix-præferencer
Hvilepuls og BMI
Diagnoser
Køn, alder, civilstand
Kreditkortbrug
Lønindkomst
RESULTAT
Gruppering:
Hvem minder han om?
Anormalitetsdetektion:
Er han et menneske?
Klassifikation:
Social bedrager?
Kræftsyg?
Dårlig betaler?
Vinelsker?
Regression:
Forventet levealder?
Livsløn?
Body Mass Index?
Risiko% for diabetes?
Find den ”funktion”, der bedst muligt…
24
1. Beskriver sammenhængen
mellem attributter og kendte
resultater for en række objekter.
2. Forudsiger (prædikterer) svaret
for et ukendt objekt baseret på
objektets attributter.
Bedst muligt?
• Hurtigst, billigst
• Flest “sandt positive” og “sandt negative”
• Færrest “falsk negative” og “falsk positive”
Diagnose 1Diagnose 2
Diagnose 3
Artsbestemmelse af iris
25
Iris setosa
Iris versicolor
+ Iris virginica
Attribut 1: Bredde af bægerblad
Attribut2:Breddeafkronblad
Iris setosa
0 5
2
0
Iris versicolor
Regelstyring et hyppigt alternativ
26
IF ( (Blodprøvesvar1>0,5) AND
(Blodprøvesvar2<1,0 OR Blodprøvesvar3<0,5) )
{Diagnose1}
ELSE {Diagnose2} ;
27
To do-liste
1. Problemformulering
2. Løsningsmuligheder
3. Indsamling af relevante data
4. Klargøring af data
5. Teknisk metodevalg
6. Træning af model
7. Implementering  Aktiv læring
28
1. Problemformulering
29
Der er problemer med et stigende antal
reklamationer på vores LEGO-klodser.
Dette har betydelige konsekvenser for
serviceomkostninger og kundeloyalitet.
2. Løsningsmuligheder
30
Løsning: Byg algoritme, der kan ”teste”
en ny LEGO-klods, før den går i
produktion.
3. Indsamling af relevante data
31
4. Klargøring af data
32
+
4. Klargøring af data
33
5. Teknisk metodevalg
• Ønsket resultat: Klassifikation [JA/NEJ]
• Endeligt attributvalg:
• Modeltype:
• Optimeringskriterier:
• Straf for modelkompleksitet:
• Matematisk optimeringsmetode:
6. Evaluering af modeller
35
1
2
3
4
5
Model 1 Model 2 Model 3 Model 4 Model 5
1 2 3 4 5
Performance
model 1
Performance
model 2
Performance
model 3
Performance
model 4
Performance
model 5
36
7. Implementering / aktiv læring
HUND!
KAT!
?
Will it
break?
38
Forfriskning og pause
39
Maskinlæring i sundhedssektoren
• Alle kontaktpunkter:
– Privatpraktiserende læge og vagtlæger
– Speciallæger
– Private og offentlige sygehuse
– Apoteker
– Kommunal hjemmepleje
– Kommunale sagsbehandlere
40
Den offentlige sektors viden om Thomas
Maskinlæringsnirvana…
41
Radiologisvar
Årligt: 700.000
Siden 2000: 11 millioner
Sundhedsfaglige registreringer (SFI)
Årligt: 100 millioner
Siden 2011: 400 millioner
Laboratoriesvar
Årligt: 40 millioner
Siden 2008: 225 millioner
Medicinadministrationer
Årligt: 13 millioner
Siden 2004: 100 millioner
Vævsprøveanalyser, mikrobiologi, registreringer af utilsigtede
hændelser, logistikdata, indkøbsdata, økonomidata, personaledata,
borger-stamdata, gendata, …
§
• Alle kontaktpunkter:
– Badevægt
– Apple Watch
– Endomondo
– Blodtryksapparat
– Toilet
– Min DNA-profil
42
Egen viden om Thomas
Eller hvad med…
43
http://www.nature.com/nature/journal/v529/n7587/full/nature16521.html
44
Attributter:
Symptomer
Kliniske fund
Prøvesvar
Medicinprofil
Diagnoser
Genetikdata
Sygdom i familien
Vægt, højde, BMI
Køn, alder
Civilstand
KRAM-faktorer
RESULTAT
Gruppering:
Borgersegment?
Anormalitetsdetektion:
Akutindsats påkrævet?
Klassifikation:
Medicinprofil OK?
Bud på diagnose?
Overlever indgreb?
Bedste behandling?
Regression:
Livskvalitetsscore?
Antal leveår?
Omkostning/gevinst?
Ustruktureret tekst
45
Tekstanalyse
46
Emnemærkning, konstruktion af attributter
Stemningsklassifikation
Watson for Oncology
47
Watson for Oncology
48
Google
49
http://googleresearch.blogspot.dk/2015/03/large-scale-machine-learning-for-drug.html
TeleSkin (skinScan)
50
Modernizing Medicine
51
https://www.modmed.com/ophthalmology/improve-outcomes/
Your.md
52
23andMe
53
23andMe
54
55
56
57
Krav:
Signifikant ”bedre”
resultat end ingen
screening.
”Bedre” målt som
livskvalitet,
økonomi, leveår,
…
Evidensbaseret beslutningsstøtte
• Skal vi operere eller medicinere?
• Er der en bedre medicinprofil?
• Hvilken type pacemaker er bedst?
• Møder John til behandlingen?
• Hvilke målinger bør jeg foretage?
• Hvornår bør vi indkalde John?
58MASKINLÆRING PÅ KORT SIGT
59
Case: Prædiktion af genindlæggelser
Lidt om mig selv
• 24 år, lige flyttet til Aarhus
• Kandidatstuderende i Sundhedsteknologi på AAU,
mangler lige mit speciale
• Forrige semester: Udlandsophold i Australien
• Arbejde med genindlæggelsesmodeller
60
Baggrund for projektet
Genindlæggelsesrater er en kvalitetsparameter
• USA: Offentligt økonomisk tilskud til hospitaler på baggrund af genindlæggelsesrater [1]
• DK: Kvalitetsparametre testes som supplement til afregningsgrundlaget [2]
61
Genindlæggelser er skidt for sundheden og samfundsøkonomien
• Definition: Akut hospitalsindlæggelse 4 timer – 30 dage efter udskrivning
• Reducér genindlæggelser?  Identificér højrisikopatienter
• Intensiveret overgangspleje kan reducere risikoen for genindlæggelse [1]
• DK: Bedre overgang fra regional til kommunal behandling i Danmark
[1]: D. Kansagara et al: “Risk prediction models for hospital readmission: a systematic review,”
Jama, vol. 306, no. 15, pp. 1688–1698, 2011.
[2]: K.M. Pedersen: ”Økonomistyring i den offentlige sektor: Kvantitet, kvalitet og sammenhæng i
opgaveløsningen”, no.2:2015
Hvorfor maskinlæring?
• Maskinlæring giver store fordele
• Viser de vigtigste attributter i forhold til genindlæggelser
• Sandsynlighedsvurderer hver patient i forhold til risiko for genindlæggelse
62
• Nødvendighed: Uoverskueligt stort datasæt
• 6,6 millioner unikke patienter
• 25 millioner forløb
• Administrative informationer om hvert forløb fra en 10-årig periode
• Alder, køn, indlæggelse- og udskrivningstidspunkt,
diagnosekoder m.m.
Resultater
63
• Endeligt datasæt:
5,8 millioner forløb
• Opdeling af data til
træning og test af
model
• Præcision: Model
gætter rigtigt i 92,5%
af tilfældene
Vigtighed
(1 = vigtigst)
Attribut Uddybning
1. Overordnet diagnosekategori F.eks. ”kredsløbsforstyrrelse”, eller
”forstyrrelse i fordøjelsessystem”
2. Komorbiditets-indeks Score, som beskriver patientens
sundhedstilstand på tværs af alle patientens
nuværende sygdomme
3. Hospitalskode Unik kode for hvert hospital,
f.eks. ”Hospital 1”, ”Hospital 2”..
4. Alder i år
5. Henvist fra ”Praktiserende læge”, ”Akut”…
6. Henvist til ”Praktiserende læge”, ”Plejehjem”...
7. Køn ”Mand”, ”Kvinde”, ”Uvis”…
8. Indlæggelsestid i timer Under patientens nuværende forløb
9. Totalt antal af forløb Fra hele patientens sygehistorik
10. Afdelingstype F.eks. Onkologi, Dialyse eller Akutafsnit
… … …
18 Udskrivningsmåde ”Udskrevet af hospital”, ”Død”..
Diskussion og læring
• ”For grov” præprocessering
– Fjerner bestemte patientgrupper – ej den ”rigtige verden”
– Viden om dine data (populationen) er alfa og omega!
• Model er ikke endeligt valideret på patienter i realtid
• Sandsynlighed for genindlæggelse er ingen redning
– Vi kan identificere patienter med høj risiko for genindlæggelse
– Hvordan kan/skal denne information bedst udnyttes?
64
65
66
Afrunding og opsummering
Gode data
67
https://data.digitaliser.dk/alle
Gode værktøjer
68
Tilgængeligt i skyen, ingen installation
Brugervenligt / Amazon-kvalitet
Billigt (4 kr./time)
Uendeligt skalérbart
Gratis
Open source
Vi stiller LEGO-WEKA-filerne til rådighed
Moderate datamængder
Gratis
Open source
Omfattende men veldokumenteret
Skalerer fornuftigt
http://www.infoworld.com/article/2853707/machine-learning/11-open-source-tools-machine-learning.html
God læsning
69
”…it is close to being the perfect guide
for the intelligent reader who, regardless
of whether s/he has a tech background,
has a sincere desire to learn how the
tools and principles of data science can
be used to extract meaningful
information from huge datasets.”
God lytning
70
http://www.thetalkingmachines.com/
”… your window into the world of ML
… conversations with experts in the
field … discussions of industry news,
and useful answers to your questions.
ML is changing the questions we can
ask of the world around us, here we
explore how to ask the best questions
and what to do with the answers.”
God læring
71
Krav til gode samarbejdspartnere
72
VS
Krav til gode samarbejdspartnere
73
VS
Gode idéer?
74
Jacob Høy Berthelsen
jhb@enversion.dk
Thomas Schultz
tms@enversion.dk
Bo Thiesson
thiesson@enversion.dk
VI SES
Opfølgning
• Gense dagen på YouTube (Enversion-kanalen)
• Gense slides på SlideShare
• Hent LEGO-datasættet og WEKA-filer på enversion.dk
• Se billeder fra dagen på Facebook
• Følg os på LinkedIn, Twitter og Facebook
• Connect med os på LinkedIn
• Giv os feedback på tms@enversion.dk
75
Inge Lehmanns Gade 10
8000 Aarhus C
E-mail: info@enversion.dk
Telefon: +45 70 23 26 20
Tak (næsten) for i dag
77
Spørgsmål og svar

Contenu connexe

Similaire à Machine learning og perspektiver for sundhedssektoren - Enversion A/S

Datasikkerhed i sundhedsvæsenet - Pseudonymiseringsprincipper og metoder
Datasikkerhed i sundhedsvæsenet - Pseudonymiseringsprincipper og metoderDatasikkerhed i sundhedsvæsenet - Pseudonymiseringsprincipper og metoder
Datasikkerhed i sundhedsvæsenet - Pseudonymiseringsprincipper og metoderMikkel Ingwar Karlsen
 
Design og evaluering af et koncept til selvmonitorering af Birthe Kjeldsen, C...
Design og evaluering af et koncept til selvmonitorering af Birthe Kjeldsen, C...Design og evaluering af et koncept til selvmonitorering af Birthe Kjeldsen, C...
Design og evaluering af et koncept til selvmonitorering af Birthe Kjeldsen, C...InfinIT - Innovationsnetværket for it
 
Inno event 2012 concept
Inno event 2012 conceptInno event 2012 concept
Inno event 2012 concepttake22
 
2014 05-28 hat afslutningsseminar
2014 05-28 hat afslutningsseminar2014 05-28 hat afslutningsseminar
2014 05-28 hat afslutningsseminarmgra_ibs
 
GE healthcare nyt_2015
GE healthcare nyt_2015GE healthcare nyt_2015
GE healthcare nyt_2015Camilla Oliver
 
Standarder styrker brugerinvolvering
Standarder styrker brugerinvolveringStandarder styrker brugerinvolvering
Standarder styrker brugerinvolveringDansk Standard
 
CV Capgemini Sogeti Else Glenthøj Sanogo
CV Capgemini Sogeti Else Glenthøj SanogoCV Capgemini Sogeti Else Glenthøj Sanogo
CV Capgemini Sogeti Else Glenthøj SanogoElse Glenthøj Sanogo
 

Similaire à Machine learning og perspektiver for sundhedssektoren - Enversion A/S (13)

Datasikkerhed i sundhedsvæsenet - Pseudonymiseringsprincipper og metoder
Datasikkerhed i sundhedsvæsenet - Pseudonymiseringsprincipper og metoderDatasikkerhed i sundhedsvæsenet - Pseudonymiseringsprincipper og metoder
Datasikkerhed i sundhedsvæsenet - Pseudonymiseringsprincipper og metoder
 
Design og evaluering af et koncept til selvmonitorering af Birthe Kjeldsen, C...
Design og evaluering af et koncept til selvmonitorering af Birthe Kjeldsen, C...Design og evaluering af et koncept til selvmonitorering af Birthe Kjeldsen, C...
Design og evaluering af et koncept til selvmonitorering af Birthe Kjeldsen, C...
 
Inno event 2012 concept
Inno event 2012 conceptInno event 2012 concept
Inno event 2012 concept
 
2014 05-28 hat afslutningsseminar
2014 05-28 hat afslutningsseminar2014 05-28 hat afslutningsseminar
2014 05-28 hat afslutningsseminar
 
Designworkshops og prototyping af Ulrich Böttger, CSC Scandihealth
Designworkshops og prototyping af Ulrich Böttger, CSC ScandihealthDesignworkshops og prototyping af Ulrich Böttger, CSC Scandihealth
Designworkshops og prototyping af Ulrich Böttger, CSC Scandihealth
 
Blad nr. 2 - 2015 side 14-15
Blad nr. 2 - 2015 side 14-15Blad nr. 2 - 2015 side 14-15
Blad nr. 2 - 2015 side 14-15
 
Sund Innovation i Randers
Sund Innovation i RandersSund Innovation i Randers
Sund Innovation i Randers
 
GE healthcare nyt_2015
GE healthcare nyt_2015GE healthcare nyt_2015
GE healthcare nyt_2015
 
Standarder styrker brugerinvolvering
Standarder styrker brugerinvolveringStandarder styrker brugerinvolvering
Standarder styrker brugerinvolvering
 
Synstræning kea 230913
Synstræning kea 230913Synstræning kea 230913
Synstræning kea 230913
 
Kenny erleben infinit_workshop
Kenny erleben infinit_workshopKenny erleben infinit_workshop
Kenny erleben infinit_workshop
 
02 systematik amo's arbejde
02 systematik   amo's arbejde02 systematik   amo's arbejde
02 systematik amo's arbejde
 
CV Capgemini Sogeti Else Glenthøj Sanogo
CV Capgemini Sogeti Else Glenthøj SanogoCV Capgemini Sogeti Else Glenthøj Sanogo
CV Capgemini Sogeti Else Glenthøj Sanogo
 

Machine learning og perspektiver for sundhedssektoren - Enversion A/S