Teknologiens udvikling gør det i dag muligt at bygge systemer, der kan assistere f.eks. læger i at træffe den bedst mulige beslutning i en given situation. Systemer baseret på machine learning (et skridt på vejen mod kunstig intelligens) - kan overskue, bearbejde og finde mønstre i langt flere data end mennesket er i stand til. Se hele foredraget på YouTube: https://www.youtube.com/watch?v=hWdzCHOxJbM
2. Dagens program
• 14:00 Velkommen og et par ord om kunstig intelligens
• 14:20 Introduktion til maskinlæring
• 15:00 LEGO-demonstration – ”Will it break”?
• 15:30 Forfriskning og pause
• 16:00 Maskinlæring i sundhedssektoren
• 16:45 Afrunding og opsummering
• 17:00 Spørgsmål og svar
2
4. 4
Det er ønsket om at gøre danskerne til
det sundeste folk i verden, der er
drivkraften bag Enversion.
Læs mere på enversion.dk eller følg os på Facebook, LinkedIn, Twitter
11. 11
Enorme datamængder Begrænset baggrundsviden
Genial til specialopgaver Multikunstner
Intet ”hvorfor” Holdninger, fantasi, etik, moral
Sandsynligheder Intuition
Ingen dårlige dage Performance afhænger af dagsform
19. 19
Attributter:
Eksisterende data,
der beskriver
objektets
forskellige
egenskaber.
(features)
Objektet:
Et eller andet,
man gerne vil
kunne udtale sig
om, f.eks.:
En borger
Et modermærke
Nogle symptomer
En spillefilm
En LEGO-klods
En kunde
Et journalopslag
En fakturalinje
…
RESULTAT
Gruppering:
Tilhørsforhold til andre
objekter.
Anormalitetsdetektion:
Afvigere (fra andre
normale objekter).
Klassifikation:
Ønsket viden
Kan ”puttes i kasser”.
Regression:
Ønsket viden
Kan tælles.
21. 21
Attributter:
Vægt
Dimensioner
Massefylde
Antal bøjelige led
Farve(r)
Antal enkeltdele
Produktionsår
Serienavn
Antal fikspunkter
Pigment(er)
Hårdhed
#solgte enheder
SIMPLEATTRIBUTTER
RESULTAT
Gruppering:
Klodstype?
Anormalitetsdetektion:
Er det en LEGO-klods?
Klassifikation:
Er den populær?
Er den skrøbelig?
Vil den flyde på vand?
Er den farlig for børn?
Regression:
Brugtpris?
Reklamationsrate?
Maksimal stablingshøjde?
24. Find den ”funktion”, der bedst muligt…
24
1. Beskriver sammenhængen
mellem attributter og kendte
resultater for en række objekter.
2. Forudsiger (prædikterer) svaret
for et ukendt objekt baseret på
objektets attributter.
Bedst muligt?
• Hurtigst, billigst
• Flest “sandt positive” og “sandt negative”
• Færrest “falsk negative” og “falsk positive”
Diagnose 1Diagnose 2
Diagnose 3
28. To do-liste
1. Problemformulering
2. Løsningsmuligheder
3. Indsamling af relevante data
4. Klargøring af data
5. Teknisk metodevalg
6. Træning af model
7. Implementering Aktiv læring
28
29. 1. Problemformulering
29
Der er problemer med et stigende antal
reklamationer på vores LEGO-klodser.
Dette har betydelige konsekvenser for
serviceomkostninger og kundeloyalitet.
35. 6. Evaluering af modeller
35
1
2
3
4
5
Model 1 Model 2 Model 3 Model 4 Model 5
1 2 3 4 5
Performance
model 1
Performance
model 2
Performance
model 3
Performance
model 4
Performance
model 5
40. • Alle kontaktpunkter:
– Privatpraktiserende læge og vagtlæger
– Speciallæger
– Private og offentlige sygehuse
– Apoteker
– Kommunal hjemmepleje
– Kommunale sagsbehandlere
40
Den offentlige sektors viden om Thomas
41. Maskinlæringsnirvana…
41
Radiologisvar
Årligt: 700.000
Siden 2000: 11 millioner
Sundhedsfaglige registreringer (SFI)
Årligt: 100 millioner
Siden 2011: 400 millioner
Laboratoriesvar
Årligt: 40 millioner
Siden 2008: 225 millioner
Medicinadministrationer
Årligt: 13 millioner
Siden 2004: 100 millioner
Vævsprøveanalyser, mikrobiologi, registreringer af utilsigtede
hændelser, logistikdata, indkøbsdata, økonomidata, personaledata,
borger-stamdata, gendata, …
§
42. • Alle kontaktpunkter:
– Badevægt
– Apple Watch
– Endomondo
– Blodtryksapparat
– Toilet
– Min DNA-profil
42
Egen viden om Thomas
58. Evidensbaseret beslutningsstøtte
• Skal vi operere eller medicinere?
• Er der en bedre medicinprofil?
• Hvilken type pacemaker er bedst?
• Møder John til behandlingen?
• Hvilke målinger bør jeg foretage?
• Hvornår bør vi indkalde John?
58MASKINLÆRING PÅ KORT SIGT
60. Lidt om mig selv
• 24 år, lige flyttet til Aarhus
• Kandidatstuderende i Sundhedsteknologi på AAU,
mangler lige mit speciale
• Forrige semester: Udlandsophold i Australien
• Arbejde med genindlæggelsesmodeller
60
61. Baggrund for projektet
Genindlæggelsesrater er en kvalitetsparameter
• USA: Offentligt økonomisk tilskud til hospitaler på baggrund af genindlæggelsesrater [1]
• DK: Kvalitetsparametre testes som supplement til afregningsgrundlaget [2]
61
Genindlæggelser er skidt for sundheden og samfundsøkonomien
• Definition: Akut hospitalsindlæggelse 4 timer – 30 dage efter udskrivning
• Reducér genindlæggelser? Identificér højrisikopatienter
• Intensiveret overgangspleje kan reducere risikoen for genindlæggelse [1]
• DK: Bedre overgang fra regional til kommunal behandling i Danmark
[1]: D. Kansagara et al: “Risk prediction models for hospital readmission: a systematic review,”
Jama, vol. 306, no. 15, pp. 1688–1698, 2011.
[2]: K.M. Pedersen: ”Økonomistyring i den offentlige sektor: Kvantitet, kvalitet og sammenhæng i
opgaveløsningen”, no.2:2015
62. Hvorfor maskinlæring?
• Maskinlæring giver store fordele
• Viser de vigtigste attributter i forhold til genindlæggelser
• Sandsynlighedsvurderer hver patient i forhold til risiko for genindlæggelse
62
• Nødvendighed: Uoverskueligt stort datasæt
• 6,6 millioner unikke patienter
• 25 millioner forløb
• Administrative informationer om hvert forløb fra en 10-årig periode
• Alder, køn, indlæggelse- og udskrivningstidspunkt,
diagnosekoder m.m.
63. Resultater
63
• Endeligt datasæt:
5,8 millioner forløb
• Opdeling af data til
træning og test af
model
• Præcision: Model
gætter rigtigt i 92,5%
af tilfældene
Vigtighed
(1 = vigtigst)
Attribut Uddybning
1. Overordnet diagnosekategori F.eks. ”kredsløbsforstyrrelse”, eller
”forstyrrelse i fordøjelsessystem”
2. Komorbiditets-indeks Score, som beskriver patientens
sundhedstilstand på tværs af alle patientens
nuværende sygdomme
3. Hospitalskode Unik kode for hvert hospital,
f.eks. ”Hospital 1”, ”Hospital 2”..
4. Alder i år
5. Henvist fra ”Praktiserende læge”, ”Akut”…
6. Henvist til ”Praktiserende læge”, ”Plejehjem”...
7. Køn ”Mand”, ”Kvinde”, ”Uvis”…
8. Indlæggelsestid i timer Under patientens nuværende forløb
9. Totalt antal af forløb Fra hele patientens sygehistorik
10. Afdelingstype F.eks. Onkologi, Dialyse eller Akutafsnit
… … …
18 Udskrivningsmåde ”Udskrevet af hospital”, ”Død”..
64. Diskussion og læring
• ”For grov” præprocessering
– Fjerner bestemte patientgrupper – ej den ”rigtige verden”
– Viden om dine data (populationen) er alfa og omega!
• Model er ikke endeligt valideret på patienter i realtid
• Sandsynlighed for genindlæggelse er ingen redning
– Vi kan identificere patienter med høj risiko for genindlæggelse
– Hvordan kan/skal denne information bedst udnyttes?
64
68. Gode værktøjer
68
Tilgængeligt i skyen, ingen installation
Brugervenligt / Amazon-kvalitet
Billigt (4 kr./time)
Uendeligt skalérbart
Gratis
Open source
Vi stiller LEGO-WEKA-filerne til rådighed
Moderate datamængder
Gratis
Open source
Omfattende men veldokumenteret
Skalerer fornuftigt
http://www.infoworld.com/article/2853707/machine-learning/11-open-source-tools-machine-learning.html
69. God læsning
69
”…it is close to being the perfect guide
for the intelligent reader who, regardless
of whether s/he has a tech background,
has a sincere desire to learn how the
tools and principles of data science can
be used to extract meaningful
information from huge datasets.”
70. God lytning
70
http://www.thetalkingmachines.com/
”… your window into the world of ML
… conversations with experts in the
field … discussions of industry news,
and useful answers to your questions.
ML is changing the questions we can
ask of the world around us, here we
explore how to ask the best questions
and what to do with the answers.”
74. Gode idéer?
74
Jacob Høy Berthelsen
jhb@enversion.dk
Thomas Schultz
tms@enversion.dk
Bo Thiesson
thiesson@enversion.dk
75. VI SES
Opfølgning
• Gense dagen på YouTube (Enversion-kanalen)
• Gense slides på SlideShare
• Hent LEGO-datasættet og WEKA-filer på enversion.dk
• Se billeder fra dagen på Facebook
• Følg os på LinkedIn, Twitter og Facebook
• Connect med os på LinkedIn
• Giv os feedback på tms@enversion.dk
75
76. Inge Lehmanns Gade 10
8000 Aarhus C
E-mail: info@enversion.dk
Telefon: +45 70 23 26 20
Tak (næsten) for i dag