Door Lisette van Gemert-Pijnen en Iris ten Klooster.

Data gestuurde gezondheidszorg wordt steeds meer mogelijk door wet- en regelgeving die het delen en hergebruik van data versoepelt (o.a. Health Data Space Act) en door de bereidheid van zorginstellingen om datasets te delen voor training van AI-modellen. De vraag is wat de implicaties zijn van AI-toepassingen voor het doen van onderzoek? Hoe de robuustheid, accuraatheid en reproduceerbaarheid van data gestuurde conclusies gegarandeerd kan worden? En vooral ook, wat de rol van de zorgprofessional zelf is in data gestuurde bewijsvoering. Deze kwesties komen aan de orde in artikelen over de toepassing van AI in het medische domein en wat dat betekent voor het doen van onderzoek, in het bijzonder op de waarde van statistiek voor de besluitvorming.  

AI en conventionele statistiek 

Een recent voorbeeld hiervan is het artikel van Hunter en Holmes in the New England Journal of Medicine. Zij laten zien welke statistische uitdagingen AI-toepassingen met zich meebrengen in het medisch domein en welke lessen we daaruit kunnen trekken voor medisch onderzoek. Het artikel geeft weer wat de “manier van redeneren” is gebaseerd op AI ten opzichte van de toepassing van de conventionele statistiek. Die laatste is vooral hypothese testend, niet zozeer vormend. De verschillen en overeenkomsten tussen AI-modellen en conventionele statistiek worden toegelicht en fraai geïllustreerd in figuur en tabel in het artikel, die handig zijn voor educatie aan studenten in medische opleidingeni

In die figuur en tabel wordt duidelijk dat de mogelijkheid om op te schalen naar multimodale data sets bij conventionele statistiek beperkt wordt door het vooraf geselecteerd aantal variabelen dat in de analyse (handmatig) wordt meegenomen. Dit in tegenstelling tot AI waarbij de voorspellende variabelen in een iteratief proces uit (grote hoeveelheden) data worden samengesteld. Dit proces kan geautomatiseerd zijn, waarbij de meeste relevante kenmerken uit de data worden geïdentificeerd zonder expliciete instructies van degene die het AI-model ontwikkelt. Dit maakt AI geschikt voor predicties op basis van grote datasets en voor het genereren van nieuwe hypothesen. Van belang is om van deze individuele gerichte predicties uit AI-modellen te komen tot risicoprofilering in een populatie, denk hierbij aan voorspellen van long-covid. 

De kritische noot is dat de manier waarop conclusies uit de data worden getrokken ondoorzichtig kan zijn doordat er vooraf geen duidelijke selectie van variabelen heeft plaatsgevonden en doordat de set van variabelen voor predictie soms moeilijk te interpreteren kunnen zijn. Daarnaast kan AI een bias kan opleveren omdat er verbanden gelegd worden die een vertekend beeld kunnen geven door algoritmen die bijvoorbeeld bepaalde groepen in een verkeerd daglicht zetten (discriminatie op basis van afkomst, sociaaleconomische status), zie ook dit artikel. Daarentegen is de conventionele statistiek te statisch doordat de doorgaans kleine en homogene datasets bepaalde factoren zoals omgeving- en leefstijlfactoren, gedrag uitsluiten omdat die te veel “ruis” veroorzaken. Omvangrijke, heterogene datasets met veel “ruis” kunnen juist onverwachte en niet voorziene factoren identificeren zoals de relatie tussen een ziekte en de omgeving, bijvoorbeeld de invloed van pesticiden op Parkinson. De Randomized Controlled Trials die in het medisch domein als standaard gelden, hebben een beperkte meerwaarde voor de praktijk. De gecontroleerde setting hindert de vertaling van bevindingen naar de praktijk. De toegevoegde waarde van AI is de capaciteit om in complexe, heterogene en grote datasets patronen te identificeren, en het vermogen om die grote datasets te reduceren zodat individuele behandeling mogelijk wordt.  

AI maakt gepersonaliseerde zorg mogelijk  

Voor gepersonaliseerde zorg, zoals “precision medicine” is AI van betekenis om geïndividualiseerde behandeling mogelijk te maken, maar ook om profielen te identificeren voor een hoog of laag risico voor het ontwikkelen van een bepaalde ziekte of voor het verloop ervan (ontstaan van milde of zware variant van bijvoorbeeld osteoartritis of voor het ontwikkelen van ulcera bij diabetische voeten)ii.   

Door het gebruik van monitor technologieën (sensoren) is het mogelijk continue data te verzamelen over de gezondheidsconditie, leefstijl, gedrag en omgeving van een patiënt. Bijvoorbeeld voor mensen met hartfalen of diabetes. Die verzamelde data gecombineerd met data uit het EPD en genetische data leveren multimodale datasets op waarbij met toepassing van AI-besluitvormingssystemen gepersonaliseerde behandeling mogelijk wordt. Een voorbeelden hiervan is een early warning systeem voor vroegtijdige signalering van een verhoogd risico op ulcera bij diabetespatiënten (Power4FitFoot). Een ander voorbeeld is een AI-afwegingsmodel voor de IC die het geschikte moment voor ontslag van de patiënt of doorverwijzing naar een andere afdeling bepaalt (MEVA rapport). Zelfregie voor de patiënt is mogelijk door toepassing van digitale Just in Time Adaptive interventions, waarbij op basis van gegenereerde multimodale data interventies voor gedragsverandering ontworpen kunnen worden om op het juiste moment en de juiste plek te interveniëren, wanneer de patiënt het meest ontvankelijk is voor beïnvloeding. Voor dergelijke benaderingen is kennis van belang voor het verzamelen van kwalitatief hoogwaardige datasets (voldoen aan 7V model), maar vooral ook voor het interpreteren van data om bias en overfitting (waarbij ook “ruis” als voorspeller wordt meegenomen) of underfitting (waarbij relevante predictieve variabelen niet meegenomen worden) te voorkomen. 

Mixed Methods kunnen worden gebruikt waarbij zowel kwantitatieve als kwalitatieve data verzameld worden volgens bepaalde onderzoeksdesigns. Die zijn dan gericht op valideren of hypothese testen, waarbij bijvoorbeeld expert beoordeling meegenomen wordt bij de ontwikkeling van het AI-model. Op die manier, kunnen misinterpretaties en bias voorkomen worden. 

Implicaties van AI voor de zorgpraktijk 

AI wordt vooral toegepast voor onderzoek naar behandeling van kanker, hart- en vaatziekten, en aandoeningen van het zenuwstelsel. AI-gebaseerde besluitvormingsmodellen zijn een hulpmiddel voor de praktijk om data gestuurde afwegingen te maken die de individuele zorgverlener kunnen ondersteunen. Dergelijke modellen kunnen de praktijkvariatie verminderen, de kwaliteit van gezondheidszorg verbeteren, maar een risico is een verkeerd gebruik ervan door gebrek aan transparante algoritmen. Ook zijn nieuwe maten nodig voor uitkomsten (t.b.v. validering). Een voorbeeld hiervan is telemonitoring bij hartfalen ter preventie van calamiteiten en heropnames, waarbij data over de conditie van de patiënt automatisch gegenereerd en doorgegeven worden aan de zorgverleners via een early warning systeem. Patiënten ontvangen op basis van een algoritme een alarm als er een risicosituatie is geïdentificeerd. Van de zorgverlener wordt verwacht dat die de data kunnen interpreteren, en dat daar arbeidstijd en een adequate IT-infrastructuur voor geregeld is. In de praktijk bleek dat het algoritme verbeterd moest worden aangezien patiënten overbodige en onnodige alarmsignalen ontvingen. Een herziening van de drempelwaarden voor alarmering was nodig en een datareductie werd na bespreking en overweging toegepast zonder verlies van klinische waarden. De implicatie van het gebruik van data gestuurde besluitvorming is dat personeel getraind moet zijn in geavanceerde analyses, en dat er competentieprofielen moeten komen voor toepassing van digitalisering in de zorg. 

Niet alleen kennis, maar ook vertrouwen in de kwaliteit van systemen, en bereidheid om anders te werken zijn nodig voor data gestuurde zorg. Een voorbeeld hiervan kwam naar voren in de context van beslissingsondersteuning op de IC voor het bepalen welke patiënt wanneer ontslagen kan worden. Zorgverleners bleken moeite te hebben om het AI-model te accepteren omdat het klinisch denken overrulet, aangezien factoren zoals thuissituatie, tijdsdruk, ruimte op andere afdelingen niet meegenomen zijn in het datamodel, het datamodel niet passend is met hoe op een ic-beslissingen genomen worden en het AI-model te lokaal getraind is (gebrek aan datadelen bij andere instellingen). Bovendien zou het AI-model te gunstig redeneren, op aannames die niet stroken met de protocollen en meer gericht zijn op logistiek dan op toestand van de patiënt. Dit voorbeeld illustreert dat de inzet van AI een transformatie van de manier van werken impliceert, en dat gezamenlijk ontwerp van AI-besluitvormingsststemen essentieel is. De nieuwe leidraad applicaties en algoritmes in de zorg is bedoeld om verstandige afwegingen te maken voor het gebruik van AI, evenals de leidraad kwaliteit van AI in de zorg. Een relevant aandachtspunt is dat voor AI-toepassingen in de zorg samenwerking nodig is tussen ontwikkelaars, onderzoekers, zorgverleners en controlerende instanties zoals toezichthouders en zorgverzekeraars. 

Datawijsheid 

FAIR datamanagement is nodig voor borging van de kwaliteit van gegenereerde data, en verantwoord gebruik ervan. In de praktijk blijkt dat dit weerbarstig is. Er is onvoldoende data governance voor eigenaarschap, verwerkingsovereenkomsten, beschikkingsrecht van data, en gebrek aan kennis over data-labeling, pseudonimisatie en gebruik van synthetische data. Synthetische data zijn cruciaal voor de ontwikkeling van AI-toepassingen, vooral omdat   beschikbaarheid van data en privacygevoelige data in de praktijk een groot struikelblok kan zijn.  

Dit alles vereist een behoorlijke data-wijsheid, de vraag is hoe zorginstellingen en professionals daarmee omgaan? Of de zorg klaar is om zelfregie door AI aan de patiënt over te laten. Hoe de samenwerking tussen dataspecialisten en zorgverleners verloopt, welke nieuwe digitale profielen voor personeel gewenst zijn, en hoe het curriculum van zorgopleidingen en AI-leertrajecten daarop aangepast worden. De overheid speelt vooraleerst hierop in met het programma toekomstbestendige arbeidsmarkt zorg en welzijn. Hunter & Holmes besluiten dat AI de medische wetenschap veel te brengen heeft, en dat AI baat heeft bij geavanceerd statistisch denken. Bovenal, in het AI-onderzoek is een “human in the loop” aanpak essentieel, de menselijke expert die uiteindelijk de relevantie van AI-modellen en voorspellingen kan beoordelen. AI-systemen kunnen vervolgens leren van menselijke expertise en real-world casussen, zoals genoemd in dit artikel. 

i De desbetreffende figuur en tabel kunnen hier niet weergegeven worden; wij verwijzen naar het oorspronkelijke artikel (free access mogelijk) 

ii “The field has since evolved to recognize how the intersection of multi-omic data combined with medical history, social/behavioral determinants, and environmental knowledge precisely characterizes health states, disease states, and therapeutic options for affected individuals” 

Over de auteurs 

Lisette van Gemert-Pijnen is em. hoogleraar persuasive gezondheidstechnologie aan de Universiteit Twente. Zij is betrokken in diverse onderzoeks- en advies projecten voor een mensgerichte toepassing van AI in de gezondheidszorg. 

Iris ten Klooster is promovenda bij de Universiteit Twente (Lisette van Gemert-Pijnen is haar promotor) in het NWO-project Commit2Data, Power4FitFoot.  

Zoektermen op internet: 

Lisette van Gemert- Pijnen, Iris ten Klooster, AI, datawijsheid, digitalisering, data gestuurde gezondheidszorg, zorgpraktijk, gepersonaliseerde zorg