Big data of FAIR?

“Slim hergebruik van data”, dat is hoe minister De Block dataforbetterhealth.be omschrijft. De minister opende de kick-off van dit ‘big data’-project in het Brusselse DigitYser.

De zorgsector in ons land produceert ongelooflijk veel gegevens, weet de minister: gezondheidsgegevens, diagnostische gegevens, gegevens over de uitkomst van een behandeling, facturatiegegevens, data in registers, zelfgerapporteerde gegevens. “Met al die informatie hebben we goud in handen”, aldus de minister van Volksgezondheid en Sociale Zaken. De uitdaging is om die gegevens die her en der verspreid zitten te combineren, maar daarnaast om dat op een gecoördineerde manier te laten verlopen.

Metadata

Om dat mogelijk te maken, start je best met een soort catalogus. De idee om de uiteenlopende bronnen van gezondheidsdata in ons land te inventariseren en te beschrijven, is al ouder dan vandaag. Maar het werd in 2013 opgenomen in het e-gezondheidsplan als een opdracht voor Sciensano. Dat resulteerde in een ‘FAIR portal’.

De geregistreerde data kun je pas recycleren voor onderzoek – of voor opendata-projecten – als je weet waar ze leven en wat je ervan kunt verwachten. De Belgische FAIR portal (fair.healthdata.be) verzamelt de metagevens over uiteenlopende databestanden en maakt dat iedereen die kan consulteren. De verzamelde metagegevens beschrijven de opzet, de inhoud, de systematiek van de verschillende bestanden.

Het letterwoord FAIR staat voor Findable, Accessible, Interoperable and Re-usable . Achter

FAIR zit een set van principes uitgewerkt door een internationale groep van researchers en dataspecialisten.

De FAIR portal kan vandaag nog maar moeilijk anders dan nog volop in ontwikkeling zijn. Aan de hand van de metadata kun je je een beeld vormen van de structuur en de kwaliteit. Maar er toegang toe krijgen, ze aankoppelen en in nieuwe algoritmes verwerken, is nog een andere zaak. Dat vraagt nieuwe medewerking van de beheerders van betreffende databanken. De FAIR-website heeft sinds vorige week een ‘request’-knop bij iedere databank. Met een druk op die knop start je een procedure om toegang tot de gegevens zelf te vragen.

“Het is onbegonnen werk om al de data die de portal beschrijft, op pakweg een jaar tijd ook FAIR te maken”, weet Johan Van Bussel van healthdata.be. Hij is de drijvende kracht achter de portal. De bedoeling, zo vertelt hij, is om de requests die gemaakt worden te verzamelen en te analyseren. Daarmee gaat dataforbetterhealth dan aan de slag. Het zal prioriteiten vastleggen, fora creëren, workshops organiseren…

Ook minister Maggie De Block zal met argusogen toekijken wat het werkveld met de toegang tot de data onderneemt. De gebruikers wijzen de weg naar “een systematische, gestroomlijnde ontsluiting van gegevens”, de Open VLD-minister ontwikkelt voor hen vervolgens een “regulerend kader”. Begin volgend jaar zou daarover een beleidsnota het licht moeten zien.

Privacy-proof

“Bij het horen van de term big data denken veel mensen spontaan aan Big Brother die over hun schouder meekijkt”, beseft minister De Block. Het data4betterhealth-project gehoorzaamt aan de Algemene Verordening Gegevensbescherming (AVG of GDPR), verzekert Koenraad Flamant van de Beroepsvereniging van Belgische Data Protection Officers. Het project richt zich tot professionals die de principes van privacy by design

en privacy by default zeer goed kennen. Data worden gericht geregistreerd, in het kader van een onderzoeksproject, en niet willekeurig. Data kunnen niet onbeperkt worden bijgehouden tot men nog eens iets kan verzinnen dat men ermee kan doen. Ze worden vernietigd wanneer het onderzoek is afgerond. Verwerking van data gebeurt steeds transparant.

Gegevens mogen niet heridentificeerbaar zijn (dat is, met gewone middelen). De meeste data voor onderzoek zijn geanonimiseerd of gepseudonimiseerd – de data protection officer waakt erover dat ze in beide gevallen niet meer terug tot individuen kunnen worden herleid. Opendata-projecten zijn doorgaans geïnteresseerd in geaggregeerde data: percentages, totalen, gemiddelden,… De personen erachter zijn verdwenen.

DigitYser, de plaats waar de kick-off plaatsvond, is een forum voor communities rond digitale technologieën. Het is een samenwerkingverband tussen het Brusselse Gewest en een plethora van privépartners. Een reminder dat ook dataforbetterhealth.be er niet alleen is voor non-profitprojecten maar tevens voor de bedrijfswereld.

www.dataforbetterhealt.be (bevat koppelingen naar de FAIR portal en de kick-off op youtube)

Wouter Colson ■

X
X