Big data zijn een big deal in de genees­kunde. Worden die beloften ingelost?

Een stortvloed aan informatie over onze genen, de staat van ons lichaam en ons gedrag moet toelaten ons langer gezond te houden en op maat te behandelen. Maar de uitdagingen voor artsen blijven groot.

In 2008 begonnen de prestaties van de Amerikaanse honkballer David Ortiz achteruit te boeren. Bij zijn club, de Red Sox, rezen vragen over de toekomst van de inmiddels 32-jarige topsporter. Was het moment gekomen om ‘Big Papi’ de laan uit te sturen? Dat deed de club niet. De baseballbonzen waren geduldig. Dat loonde: Ortiz klom terug uit het dal en schopte het in 2013 zelfs tot speler van het jaar.

‘Onze kinderen zullen een digitale dubbelganger hebben, een verzameling van alle informatie over hun persoonlijke gezondheid’

Waarom hadden de Red Sox hun schijnbaar oude en versleten slagman tijdens zijn professionele depressie niet afgedankt? Omdat ze niet vertrouwden op hun gevoel, maar op big data. De club gebruikte een model met daarin alle beschikbare informatie over alle 18.000 spelers uit de geschiedenis van de Major League en het verloop van hun carrière. Daarin gingen ze op zoek naar spelers die op Ortiz leken. Die ‘dubbelgangers’ kenden eveneens een dipje als prille dertigers, om vervolgens opnieuw te schitteren. Zo verging het ook de Red Sox-vedette.

Seth Stephens-Davidowitz, voormalig datawetenschapper bij Google, vertelt het verhaal van Ortiz in zijn boek Everybody Lies, waarin hij de mogelijkheden van big data verkent. Zoals big data in het honkbal – waar hun gebruik goed is ingeburgerd – tot betere beslissingen leiden, kunnen ze dat volgens datawetenschappers zoals Stephens-Davidowitz ook in de geneeskunde. Alleen moeten we dan geen informatie verzamelen over slagen en home-runs, maar over onze genen, bloedwaarden, ziektes en gewoontes. Door vervolgens grote groepen mensen met elkaar te vergelijken, kunnen we beter begrijpen wie risico loopt op welke ziektes en wie gebaat is bij welke behandeling.

Die evolutie is volop aan de gang. Volgens IBM verdubbelt de hoeveelheid medische data elke drie jaar. Het einddoel is volgens sommigen een persoonlijke ‘digitale dubbelganger’: een verzameling van al onze gezondheidsinformatie die helpt ons zo lang mogelijk gezond te houden en op maat te behandelen.

Altijd traceerbaar

‘Onze kinderen zullen zeker zo’n dubbelganger hebben’, zegt Koen Kas, gezondheidsfuturoloog en moleculair oncoloog aan de Universiteit Gent. Kas is betrokken bij het Health EU-project: bijna vijftig onderzoeksinstellingen hengelen samen naar een Europese onderzoekssubsidie van een miljard euro om een eerste rudimentaire versie van zo’n dubbelganger te bouwen.

Een sensor monitort de toestand van een patiënt. Bij een risico op complicaties of overlijden krijgt de arts een waarschuwing.

‘Het grote probleem vandaag is dat mijn dokter mij niet echt kent’, zegt Kas. ‘Als ik met de post een pakje verstuur, dan kan ik het traject ervan tot op de minuut volgen. Mijn arts zie ik een paar keer per jaar. Voor de overige 8.750 uur weet die niets over mij. Dat zal veranderen door de toenemende mogelijkheden om in real time gegevens over mensen te verzamelen, gecombineerd met de ontwikkelingen in de biologie.’

Kas verwijst naar de traditie van Chinese dorpsdokters, die werden betaald zolang ze hun patiënten gezond wisten te houden. ‘Naar die focus op preventie moeten we terug’, zegt Kas. ‘Van elke 100 euro die we vandaag investeren in gezondheidszorg gaat 90 euro naar onze laatste twee levensjaren, en minder dan een euro naar preventie.’ Voor die omslag moeten we wel iets over hebben. ‘De ultieme gepersonaliseerde en preventieve geneeskunde is pas mogelijk als ik 24 op 24 alles over je weet’, zegt Kas.

Dat klinkt behoorlijk Big Brother-achtig, maar volgens Kas zullen nieuwe diensten, zoals het Belgische platform voor databasebeheer Geens.com, ons toelaten baas over eigen data te zijn, en te bepalen wie er toegang tot krijgt. ‘Als ik in de Verenigde Staten naar Disneyland ga, dan krijg ik een polsbandje om. Op basis van mijn locatie krijg ik dan een bericht dat ik mij het best naar Space Mountain begeef om lang aanschuiven te vermijden. Ik ben bereid daarvoor wat privacy op te offeren.’ Zo zal het volgens Kas ook in de geneeskunde gaan. ‘Hoe meer data je bereid bent vrij te geven, hoe meer je kunt terugkrijgen.’

Ziek voor je het weet

Amerikaanse onderzoekers slaagden er onlangs in personen met een depressie te identificeren op basis van de filters die ze gebruiken op Instagram. Britse wetenschappers onderzoeken of ze Parkinson vroeg kunnen detecteren op basis van veranderingen in je stem als je in je smartphone praat. Een ploeg aan Stanford University verzamelde via sensoren en geregelde bloedmonsters informatie over de gezondheid van zestig proefpersonen. Goed voor 250.000 metingen per dag en 2 miljard gegevens aan het einde van de rit. De onderzoekers meldden vorig jaar hoe ze tot drie dagen voordat de proefpersonen last kregen van een infectie konden zien dat ze ziek zouden worden.

Het zijn stuk voor stuk kleine studies, maar ze geven volgens Kas wel aan in welke richting we evolueren. De Stanford-wetenschappers verwachten dat onze smartwatch ons in de toekomst zal vertellen wanneer we iets onder de veren hebben, zoals er op het dashboard van een auto een lampje gaat pinken als de olie dreigt op te raken. ‘Op termijn zullen die sensoren die we nu nog op ons lichaam dragen zich in ons lichaam of in onze omgeving bevinden’, zegt Kas. Ook hij gelooft dat wearables de moderne kanaries in de koolmijn worden.

Zover is het nog lang niet. Om te beginnen moet de betrouwbaarheid van wearables en apps omhoog. ‘Er zijn momenteel meer dan 260.000 gezondheidsapps’, weet Kas. ‘Daarvan zijn er maar 125 goed genoeg bevonden voor geneeskundig gebruik.’ Eén daarvan is het Belgische FibriCheck, een app om met een smartphone hartritmestoornissen te detecteren. De cardioloog kan vanop afstand meevolgen. Volgens het bedrijf gebruiken al vijftigduizend patiënten hun app.

Gelinkt aan die betrouwbaarheid is de zoektocht naar biomerkers die ziekte accuraat voorspellen. Die verloopt moeizaam. Om het risico op de meest gangbare ziektes zoals hart- en vaatziekten en diabetes te voorspellen, voegt een genetische analyse vooralsnog weinig toe. ‘Tot dusver hebben weinig biomerkers de medische praktijk bereikt’, zegt Kas. ‘Daarvoor hebben we veel meer studies met grote groepen vrijwilligers nodig.’ Zo wil het Britse 100.000 Genomes Project wetenschappers meer inzicht bieden in de rol van bepaalde genetische variaties door honderdduizend genomen in kaart te brengen. Het Amerikaanse Project Baseline, waaraan Google meewerkt, wil door tienduizend mensen intensief te monitoren beter begrijpen wat het betekent om gezond te zijn en ziek te worden.

Reddingsboei

Meer gegevens leiden niet automatisch tot meer inzicht. Technieken zoals data mining, waarbij computers speuren naar verbanden in grote datasets, en zelflerende systemen kunnen daarbij helpen. ‘De arts verzuipt in de data’, zegt de Nederlandse medisch-datawetenschapper Andre Dekker (Universiteit Maastricht). Hij krijgt niet alleen informatie uit allerlei scans, bloedtests en DNA-analyses voor zijn kiezen, maar ook een berg literatuur over de effectiviteit van behandelingen. Wie dat een beetje wil bijhouden, zit elke dag uren te lezen.

Computermodellen kunnen een reddingsboei voor de verzuipende arts zijn. Ze helpen moeilijke vragen te beantwoorden. Neem nu de vraag: ‘Dokter, zal ik over twee jaar nog in leven zijn?’ Gesteld dat je kanker hebt, is dat vrij fundamenteel. Toch slaat de arts de plank vaak mis. Volgens Dekker ‘kan je net zo goed een muntje opgooien’. Dekker en zijn collega’s legden oncologen gegevens voor van longkankerpatiënten die in het verleden in hun ziekenhuis waren bestraald. De uitkomst van de behandeling lieten ze weg. Daarna kwam de vraag: welke patiënten waren na twee jaar nog in leven?

De oncologen bleken die kans niet veel beter in te kunnen schatten dan je op basis van toeval zou verwachten. ‘En dan hebben we het nog niet over de vraag of een patiënt beter gebaat is met behandeling A of B’, aldus Dekker. Een door Dekker en zijn collega’s ontwikkeld zelflerend model kon via een grote set patiëntdata beter dan artsen de overlevingskansen van longkankerpatiënten voorspellen. En het bracht nog iets aan het licht: sommige patiënten die een hoge dosis radiotherapie kregen, zouden meer gebaat zijn bij een lage dosis, en vice versa.

Datamodellen om infecties te voorspellen laten artsen toe sneller in te grijpen.

Bij beslissingen kan ons brein volgens Dekker maximaal met vijf factoren rekening houden. Een computer kent die beperking niet. Dekker gelooft sterk in ‘datagedreven’ geneeskunde, waarbij artsen vandaag leren uit de behandeling van patiënten gisteren. Naarmate meer en betere data beschikbaar worden, moet dat ook voor andere kankers en ziektes kunnen.

Het model van Dekker is verre van volmaakt. Op een schaal van 0,5 tot 1 – van ‘niet beter dan toeval’ tot ‘volledig juist’ – scoren de artsen 0,57 en haalt het model 0,69. Meer data kunnen het beter maken, denkt Dekker. ‘Maar als we het in de praktijk willen gebruiken is de vraag niet: ‘Is het perfect?’, maar: ‘Is het beter dan een mens?’

Watson weet (geen) raad

Veruit het bekendste computersysteem gebruikt voor medische toepassingen is Watson. IBM’s supercomputer stelt via artificiële intelligentie kankerbehandelingen voor. Daarvoor baseert hij zich op data over de patiënt en de uitdijende medische literatuur. Daar hebben oncologen aan het Amerikaanse Memorial Sloan Kettering-ziekenhuis het systeem in getraind.

Recent kwam Watson in opspraak. Het systeem zou onorthodoxe en onveilige behandelingen hebben voorgesteld. Volgens artsen die met Watson experimenteerden, is het systeem heel wat minder intelligent dan de makers willen laten uitschijnen en is de meerwaarde in de praktijk beperkt.

Er zijn wel studies die aantonen hoe Watson sneller dan een panel experts een diagnose stelt of een niet voor de hand liggende behandeling suggereert. ‘Maar er is geen bewijs dat patiënten die met Watson zijn behandeld beter geholpen zijn’, zegt Martijn van Oijen, die aan het Academisch Medisch Centrum in Amsterdam onderzoekt hoe data en systemen zoals Watson kankertherapie kunnen verbeteren.

‘Dat ligt ook moeilijk: een geneesmiddel dat je in een klinische studie hebt onderzocht, verandert niet. Maar een systeem als Watson kan na elke update anders zijn. Dat maakt het lastig te evalueren. Dat je als arts weinig inzicht hebt in hoe het systeem tot zijn conclusies komt, maakt het bovendien lastig te vertrouwen.’ Een ander probleem is de stempel die Watsons ‘trainers’ op het systeem hebben gedrukt. ‘De Amerikaanse aanpak is vaak anders dan hoe wij het in Nederland of België zouden doen.’

De dag dat je bij een pratende robot op consult gaat, lijkt daarmee nog veraf; wellicht komt hij er zelfs nooit. Toch is Van Oijen hoopvol over de rol van big data en artificiële intelligentie in de geneeskunde. ‘Het is een tendens die niet te stoppen is.’ Artsen hoeven daarom niet voor hun job te vrezen. ‘Ik zie data en AI als een soort hulplijn, die je kan inroepen voor advies over patiënten waar onder artsen veel discussie over is. Wat denkt de computer erover?’

Iedereen een afwijking

In hoeverre zullen al die technologische snufjes, grote datasets en slimme computers onze gezondheid echt ten goede komen? Johan Decruyenaere, internist-intensivist en voorzitter van het Platform voor Medische Innovatie aan het UZ Gent, haalt er een grafiek bij. De hypecyclus van Gartner toont wat we van nieuwe technologieën verwachten in functie van de tijd. Op een piek van hooggespannen verwachtingen volgt een dal van ontgoocheling, met vervolgens een klim tot een meer realistisch beeld. ‘Wij bevinden ons nu hier’, wijst Decruyenaere naar de hoogste piek. ‘Big data kunnen de geneeskunde verbeteren, maar zijn tegelijk een enorme hype.’

Dat de waardevolle inzichten zullen komen bovendrijven als we maar genoeg data verzamelen en analyseren, is volgens Decruyenaere een illusie. ‘Data spreken niet voor zich, zoals sommigen beweren. Dé achilleshiel is dat ze wel verbanden aan het licht kunnen brengen, maar niets zeggen over causaliteit.’ Wie zonder kennis van zaken aan het graven slaat, dreigt te midden van alle ruis op het verkeerde spoor te belanden.

Enige terughoudendheid om als arts je beslissingen op big data te baseren, is op zijn plaats, vindt Decruyenaere. ‘Als Google mij op basis van data-analyse een advertentie voor BMW toont die mij niet interesseert, is dat niet zo erg. In de geneeskunde is de prijs van foute voorspellingen en beslissingen hoger. Net als nieuwe medicijnen mogen we dit soort toepassingen niet lichtzinnig invoeren.’

Maar ook wanneer onderliggende oorzaken verborgen blijven, kunnen voorspellingen op basis van big data tot betere beslissingen leiden. Zo ontwikkelde het team van Decruyenaere met data mining een manier om bij patiënten op de afdeling intensieve zorgen het risico op een bacteriële infectie te voorspellen (Zie ‘Tussen leven en dood’). ‘Als arts word je bij beslissingen altijd geconfronteerd met onzekerheid’, zegt Decruyenaere. ‘Alle hulp om die te verkleinen is welkom.’

De Nederlandse hoogleraar Huisartsgeneeskunde Niels Chavannes (Universiteit Leiden) bestudeert de mogelijkheden van e-health. Ook hij hoort veel ‘hoopvolle bespiegelingen die niet op feiten zijn gebaseerd’ en wijst op wat hij de ‘preventieparadox’ noemt. ‘De meeste technologische snufjes focussen nu op de verkeerde mensen, die al relatief gezond zijn. Dat heeft weinig zin.’

Sterker nog, het zou contraproductief kunnen zijn. In plaats van ons langer gezond te houden, zou al dat gemonitor en gemeet weleens kunnen leiden tot een toekomst waarin iedereen zich constant zorgen maakt, ziek voelt en onnodig behandeld wordt. ‘Als je maar genoeg meet, vind je bij iedereen wel een afwijking’, aldus Chavannes.

Als we in de geneeskunde de vruchten van digitale technologie willen plukken, hebben we daarom volgens Chavannes nood aan onderzoek naar kosten en baten. Dat is er nu nog te weinig. ‘Potentieel is er zeker. Maar we moeten goed onderzoeken of al die toepassingen wel doen wat ze beweren.’