Door Lisette van Gemert-Pijnen, Bastiaan van Schijndel en Hans van Vlaanderen.  

Toegang tot steeds grotere datasets – vooral wanneer gebruik wordt gemaakt van AI – verandert onderzoek en innovatie. Zorgen over privacy en veiligheid beperken echter de mate waarin gegevens nationaal en wereldwijd kunnen worden gedeeld en hergebruikt. Een opkomende en krachtige reeks technologieën (Privacy Enhancing Technologieën, kortweg PET) maakt het mogelijk om gevoelige gegevens te delen en te (her)gebruiken met behoud van privacy en veiligheid. Echter, in de gezondheidszorg worden die technieken nog niet omarmd terwijl de EHDS (zie artikel van Lies van Gennip, 8 mei 2024) de toegankelijkheid van zorgdata juist wil faciliteren. Wat is er nodig om datadeling te bevorderen? En waarom is dat van belang? 

Technologieën voor betere data benutting 

Privacy Enhancing technologieën (PET) vergemakkelijken en ondersteunen grootschalige gegevensverwerking en -analyse te en beschermen tegelijkertijd de privacy, veiligheid en gegevenskwaliteit (OECD 2023). 

Secure Multi-party computation (sMPC) en synthetische data (SD) zijn veelbelovende voorbeelden van PET-tools om gevoelige data door een versleutelingstechniek te (her)gebruiken voor personaliseerde zorg en om de effectiviteit van AI-gebaseerde klinische besluitvorming te vergroten. (Spini 2022)  

Secure Multi Party Computation (sMPC) 

Secure Multiple Party Computation en homomorfe versleuteling kunnen het veilig delen van gegevens mogelijk maken omdat de betrokken partijen slechts toegang hebben tot een fragment van de ontcijferingssleutel. Alleen na toestemming en goedkeuring van alle betrokken partijen kunnen de resterende fragmenten opnieuw worden gecombineerd. Deze methode zorgt ervoor dat de gegevens beschermd blijven totdat alle partijen een consensus bereiken, waardoor onbevoegde toegang wordt voorkomen. 

Er is ook hernieuwde interesse in homomorfe encryptie, een technologie uit de jaren 1970Homomorfe encryptie maakt het mogelijk om versleutelde data te analyseren zonder dat de ruwe data direct toegankelijk zijn. Hoewel veelbelovend, vereist een dergelijke versleuteling aanzienlijk meer energie en tijd om een veilig resultaat te bereiken. 

Secure Multi Party Computation (sMPC) in combinatie met homomorfe versleuteling levert een gereedschapskist op waarmee meerdere partijen veilig gezamenlijke analyses uit kunnen voeren op gevoelige gegevens zonder de gegevens aan elkaar bloot te stellen.  

sMPC protocollen zijn cruciaal voor gepersonaliseerde gezondheidszorg. Inzichten en gegevens uit dossiers van eerder behandelde patiënten kunnen gebruikt worden voor het opstellen van individuele behandelplannen. sMPC maakt ook snellere besluitvorming mogelijk, de beslissingstijd wordt teruggebracht van uren tot slechts enkele minuten (van Egmond et al, 2021). Door sMPC kan bias in besluitvorming en een ‘one size fits all’-behandeling worden voorkomen.  

Synthetische data en AI 

De laatste jaren is er een groeiende belangstelling voor “synthetische data” (SD) (Lu et al, 2023). Synthetische data of kunstmatig gegenereerde gegevens kunnen verschillende problemen met echte gegevens oplossen, zoals zorgen over privacy, schaarste of toegankelijkheidsproblemen. Deze techniek repliceert de patronen en trends in gevoelige datasets, maar bevatten geen specifieke informatie die gekoppeld kan worden aan individuen, organisaties of overheden. Het risico bij SD ligt in over simplificatie of verkeerde interpretaties van de onderliggende gegevens uit de “echte wereld”. Dit kan leiden tot onnauwkeurige analyses en inadequate oplossingen. Om replicatie van bias in onderliggende data te voorkomen, is het waarborgen van datakwaliteit een eerste vereiste. Dit betekent dat theoretische en statistische kennis nodig is om synthetische gegevensanalyses te beheren. 

Evaluaties waarbij de synthetische gegevens worden vergeleken met de tegenhanger van gegevens uit de “echte wereld” zijn daarom van belang, zodat discrepanties en vertekeningen tot een minimum worden beperkt (Lu et al, 2023). Hoe kleiner de statistische verschillen tussen de synthetische en “echte” gegevens, hoe beter de kwaliteit van de gesynthetiseerde gegevens. Echter kan een te klein verschil tussen de synthetische en echte data het risico op onthulling van gevoelige gegeven vergroten. Het is dus van belang dat een adequate afweging wordt gemaakt tussen nut (“utility”) en privacybescherming van een gegevensset (Carvalho et al, 2022). 

Voorbeelden van PET in de praktijk  

In de praktijk worden PETs gebruikt om gepersonaliseerde zorg mogelijk te maken. Een voorbeeld is het gebruik van MPC voor persoonlijke coaching. Voor persoonlijke coaching is diverse data nodig over gezondheidsconditie, leefwijze, woonomgeving, sociaaleconomische omstandigheden en contextuele data om op het juiste momentum te interveniëren, wanneer iemand gevoelig is voor beïnvloeding. Die verschillende databronnen kunnen worden gecombineerd om de juiste zorg op maat te leveren. Dit betekent dat diverse databronnen zodanig gedeeld moeten worden dat gegevens niet herleidbaar zijn tot personen of instellingen. Met MPC kunnen die data versleuteld worden voor analyse zonder de data uit handen te geven. Met MPC kunnen op die manier just-in -time adaptieve e-coaching strategieën ontwikkeld worden die steeds aanpasbaar zijn op basis van de continue datastroom. Op die manier kan de behandeling gepersonaliseerd worden.

Synthetische data kunnen gebruikt worden voor modeltraining en (software)testen door een dataset te genereren die geschikt is voor trainings- en testdoeleinden, zonder dat er echte, privacygevoelige gegevens hoeven te worden gebruikt. Gegevens uit de echte wereld zijn nog steeds nodig om het AI-model te trainen dat de SD genereert. 

Daarnaast kan SD worden gebruikt om hiaten in datasets op te vullen. In situaties waarin het lastig of bijna onmogelijk is om (buitenlandse) data te verkrijgen door wet- en regelgeving. Denk aan gegevens die nodig zijn voor AI-onderzoek in de gezondheidszorg om behandelingen op maat te genereren voor bijvoorbeeld zeldzame ziekten en om algoritmes te genereren voor vroegtijdige detectie van ziekten (b.v artritis, diabetes).  

Synthetische data maken snellere en gerichte inzet van innovaties in de zorg mogelijk. Zoals op AI gebaseerde patiënt specifieke besluitvormingssystemen voor het beantwoorden van vragen over adequate inzet van medicatie, welke medicatie wel of niet werkt voor een bepaalde patiënt, hoe groot de kans is dat een patiënt na ontslag van een IC terugkomt voor een heropname en wat de kans is dat een patiënt goed of slecht reageert op een bepaalde behandeling.  

Wat is van belang voor de toepassing van PET? 

Alhoewel technisch gezien de toepassing van sMPC en SD de zorg kan innoveren, zijn in de praktijk vooralsnog diverse horden te nemen. 

Wet- en regelgeving 

Voor Europa is de GDPR het leidend wettelijk kader voor privacybescherming. Binnen dit wettelijke kader verwijzen persoonsgegevens naar een identificeerbare natuurlijke persoon. Wanneer individuen niet identificeerbaar zijn, bijvoorbeeld door het gebruik van PET’s, kunnen gegevens in principe worden gebruikt voor statistische verwerking waardoor het niet langer nodig zou zijn om te voldoen aan de GDPR (Scheibner et al, 2021). Multiparty computation in combinatie met homomorfe encryptie heeft de kwaliteiten en potentie om gevoelige gegevens te verwerken die buiten de reikwijdte van GDPR vallen (Scheibner et al, 2021). Echter, er zijn discussies over anonimiseringstechnieken en herleidbaarheid. De verwachting is dat beter inzicht in en betere duiding van begrippen (peudonimisering, anonimisering, herleidbaarheid) er meer juridische ruimte is voor de toepassing van PET, en voor hergebruik van data. Vooralsnog is van belang om de juridische aspecten bij toepassing van bijvoorbeeld sMPC goed in ogenschouw te nemen (Pels Rijcken & Drooglever Fortuijn 2023)   

Bij internationale samenwerkingen kunnen verschillen in privacywetgeving een barrière vormen om data te delen. Privacywetten zijn meestal gebaseerd op dezelfde kernbegrippen. Er zijn echter opmerkelijke verschillen met betrekking tot bijvoorbeeld de rol van toestemming tussen rechtsgebieden (Scheibner et al, 2021).  

Stakeholders moeten weten of betrokken partijen rechtmatige toegang hebben tot persoonlijke gegevens of decoderingssleutels. Data Governance is belangrijk om (ethische) normen op te stellen en verantwoordelijkheden te benoemen voor toegang tot versleutelde gegevens, en om toestemming te verkrijgen van betrokken patiënten.  

Vertrouwen 

De invoering van PET hangt sterk af van het vertrouwen en de bereidheid om gegevens te delen. Vertrouwen in de mogelijkheden van technologieën om de privacy effectief en efficiënt te beschermen en vertrouwen in de governance om ongewenste resultaten te voorkomen (ethische en juridische aspecten) (Lu et al, 2023). Er is ook behoefte aan vertrouwen in de techniek en in de deelnemende partners. Samenwerking tussen betrokken belanghebbenden (medisch, ethisch, financieel, techniek, etc.) kan bewustzijn creëren en daarmee het inzicht in mogelijkheden en risico’s vergroten. 

Datawijsheid en datakwaliteit 

Er is meer opleiding en training nodig voor het gebruik van PET’s en om alle belanghebbenden beter bewust te maken van de voor- en nadelen. Het institutionaliseren van datastewards kan de organisatorische en beleidsmatige bereidheid voor PET vergroten.  

Het opschonen van gegevens, wat cruciaal is voor de toepassing van PET, wordt meestal uitgevoerd door gespecialiseerde datawetenschappers. Om dit proces lokaal uit te voeren, is het essentieel om nieuwe rollen (datastewards b.v.) en infrastructuur voor monitoring, controle en naleving te implementeren. Standaardisatie en interoperabiliteit zijn aandachtspunten en harmonisatie is van cruciaal belang. Dit omvat het vaststellen van principes voor gegevenskwaliteit en het opzetten van een kader voor het delen van gegevens om consistentie en nauwkeurigheid tussen verschillende instellingen te garanderen. 

Infrastructuur en Impact 

Investeringen zijn nodig om het gebruik van PET te financieren om een veilige IT-infrastructuur op te zetten en te onderhouden die kan voldoen aan hoge normen voor privacy en interoperabiliteit. Financiële inspanningen zijn ook nodig om data te verzamelen door middel van devices die op afstand toezicht houden en die mogelijk weinig rekenvermogen hebben. 

Nader onderzoek is nodig om beter zicht te krijgen op use cases waar PET waarde kunnen toevoegen zoals op behandeling van complexe ziekten zoals Parkinson, comorbiditeit, hart- en vaatziekten en geestelijke gezondheidsproblemen. Daarnaast is meer kennis nodig bij potentiële gebruikers om het vertrouwen in de techniek te vergroten en daarmee de bereidheid te bevorderen om met behulp van PET gegevens te delen.  

Kortom 

PETs bieden mogelijkheden voor het beter beschikbaar maken van data volgens de FAIR principes, relevant voor data gestuurde gepersonaliseerde zorg. Voor de toepassing van PET is meer praktijkonderzoek nodig naar de juridische, personele en financiële kaders waarbinnen de toepassing mogelijk is. Het afnemend aanbod van personeel maakt dit urgent. 

Over de auteurs 

Lisette van Gemert- Pijnen, Prof persuasive health technology, University of Twente 

Bastiaan van Schijndel, Innovatie manager Stichting ZorgTTP 

Hans van Vlaanderen, Directeur/Bestuurder Stichting ZorgTTP 

Zoektermen op internet:

Lisette van Gemert- Pijnen, Bastiaan van Schijndel, Hans van Vlaanderen, digitalisering, databenutting, privacy, technologie, PET, Private Enhancing Technology