Big data voor zorgpreventie bij mensen met lage sociaal-economische status

Interview met Lydia Sterrenberg en Ruud Dorenbos, projectleiders Platform31, over hun verkennende studie voor Gezond in…

Er zijn systematische verschillen in gezondheid en sterfte tussen mensen met hoge en mensen met een lage (sociaal-economische) positie in de maatschappij, zo blijkt uit de factsheet van Pharos. Met het stimuleringsprogramma Gezond in… proberen Pharos en Platform31 gezondheidsachterstanden terug te dringen. Maar kunnen big data ook helpen bij het terugdringen van gezondheidsverschillen tussen mensen met een hoge en lage sociaal-economische status (SES)? En welke rol kunnen de big data spelen bij een integrale aanpak? Dat verkenden Lydia Sterrenberg en Ruud Dorenbos in een studie naar het gebruik van big data in relatie tot zorgpreventie bij lage SES-groepen.

Er wordt steeds meer over big data gesproken, maar wat wordt er eigenlijk mee bedoeld?

Lydia: ”In het alledaags spraakgebruik wordt vaak al van big data gesproken als er verschillende databestanden worden gekoppeld. Maar dat gebeurt nu al en daarmee onderscheidt big data zich niet van ’traditionele’ data. Een andere omschrijving is ‘datasets die te groot zijn om met reguliere databasemanagementsystemen onderhouden te kunnen worden’. Gartner Inc. heeft geprobeerd om dit verder te specificeren. Zij komen uit op drie aspecten van verschil tussen big data en traditionele data:

  1. de hoeveelheid data (volume),
  2. de snelheid waarmee de data binnenkomen en/of opgevraagd worden (velocity) en
  3. de diversiteit van de data (variety).

Soms wordt daar nog een vierde aspect aan toegevoegd: waarheidsgetrouwheid (veracity). Maar al met al: het onderscheid tussen ‘gewone’ data en ‘big data’is niet scherp. Het is ook niet ‘tijdvast’. Want met de verdere ontwikkeling van ICT zal verschuiven wat wij als ‘big data’ zien.

Ruud: “In onze verkenning hebben we een omschrijving gebruikt die aansloot op een definitie van de Wetenschappelijke Raad voor het Regeringsbeleid. Die spreekt van “een ontwikkeling waarbij grote hoeveelheden gegevens, afkomstig uit verschillende gegevensbronnen, aan elkaar gerelateerd worden om te zoeken naar patronen zonder vooraf opgestelde hypothesen”. Op basis daarvan hebben we ervoor gekozen om van big data te spreken als voldaan wordt aan de volgende drie kenmerken. Ten eerste: dat de datasets afkomstig zijn van verschillende domeinen. Ten tweede: dat de datasets voor andere doeleinden gebruikt worden dan waarvoor ze oorspronkelijk zijn verzameld en, ten derde: dat er wordt gezocht naar patronen zonder directe hypotheses.

Wat was de aanleiding voor jullie verkennende studie?

Lydia: We zagen steeds meer rapporten en nieuwsberichten langskomen over big data, ook in relatie tot zorg en gezondheid. Veel van die berichten en rapporten stellen dat big data veelbelovend zijn, en tot betere zorg en preventie van zorg zouden kunnen leiden. Dat zou dan komen doordat big data zicht geeft op nieuwe verbanden tussen gezondheidsdata en ander data. Dat vonden wij interessant. Zeker in het licht van de integrale aanpak van gezondheidsachterstanden, die Gezond in… stimuleert. Dan heb je het over een meer-sporen aanpak en als je dat koppelt aan big data, over datasets die meerdere domeinen bestrijken. Bovendien, er worden ook steeds meer data buiten de zorg verzameld, door burgers zelf, door gemeenten en door commerciële partijen zoals Google, Apple, Microsoft, Philips en Fitbit. Ook data kunnen relevant zijn voor een preventieve aanpak. Bijvoorbeeld om kwetsbare mensen vroegtijdig op te sporen of om te voorkomen dat ze ziek of zieker worden. En ook om mensen meer regie over de eigen gezondheid te geven. Kortom, de rapporten en nieuwsberichten maakten ons nieuwsgierig. “ Wij vroegen ons af”, vult Ruud aan, “zijn die hoge verwachtingen terecht? Wat gebeurt er nu eigenlijk al op het terrein van big data, zorg(preventie) en lage SES groepen? Die vragen vormden de aanleiding voor een verkenning.”

Hoe hebben jullie het aangepakt?

Lydia: “We hebben eerst literatuuronderzoek gedaan. We wilden bijvoorbeeld helder krijgen over welke gezondheidsproblemen het bij lage SES-groepen precies gaat. Zo konden we beter duiden waar zorgpreventie op gericht zou moeten zijn. Ook hebben we rapporten bekeken die specifiek ingaan op de relatie tussen big data en zorg. Tegelijkertijd zijn we gaan zoeken naar voorbeelden van big data-projecten en apps die relevant konden zijn voor zorgpreventie bij lage SES-groepen. En daarna hebben we experts gesproken van een aantal instellingen – het CBS, RIVM, GGD/GHOR, VNG/KING en Vektis – die relevante databestanden hebben voor een integrale aanpak van gezondheid. Tot slot hebben we onze bevindingen voorgelegd aan een klein en divers gezelschap van mensen: onderzoekers en mensen uit de gemeentelijke en GGD-praktijk.”

Wat heeft vooral indruk gemaakt?

Ruud: “Een aantal zaken. Opvallend vonden wij vooral dat er nog maar weinig concrete resultaten zijn te vinden van onderzoek met big data, zeker voor wat betreft big data in relatie tot zorgpreventie. Laat staan dat de resultaten van dergelijk onderzoek al de weg hebben gevonden naar de (beleids)praktijk. Omdat er zoveel over big data gesproken en geschreven wordt, gingen wij er vanuit dat de voorbeelden voor het oprapen zouden liggen. Maar dat is dus niet zo. We zijn in onze verkenning bij zo’n acht voorbeelden uitgekomen; big data analyses en apps met op de achtergrond big data, die een bijdrage zouden kunnen leveren aan preventie van gezondheidsproblemen die veel bij lage SES-groepen voorkomen. De big data analyses zijn overigens niet specifiek gericht op lage SES-groepen, dat soort big data analyses hebben wij niet kunnen vinden.”

Wat voor soort voorbeelden vonden jullie?

Lydia: “Een mooi voorbeeld van een app is de Psymate. Die is ontwikkeld door de vakgroep Psychiatrie van Maastricht UMC+ en Maastricht University. De Psymate is bedoeld om patiënten en behandelaars meer grip te geven op psychische klachten in het dagelijks leven. Gebruikers kunnen in de Psymate-app hun gedachten, gevoelens en gedrag registreren. De app geeft 10 keer per dag een seintje met het verzoek een aantal vragen in te vullen. Dit zijn vragen zoals “Waar ben je? Wat doe je? Hoe voel je je?” De app zet de verzamelde data om in grafieken en schema’s. Na verloop van tijd wordt uit de registraties zichtbaar op welke momenten en in welke omstandigheden iemand zich beter of slechter voelt. De verzamelde data van de gebruikers kunnen dan verder weer benut worden voor onderzoek, mits de gebruikers daar toestemming voor geven. In Amerika zie je apps die op soortgelijke principes zijn gebaseerd.”

“Als het gaat om big data analyses is een voorbeeld een big data project in Schiedam, Vlaardingen en Maassluis dat gericht is op de vroegopsporing van armoede. Daarvoor wil men data gebruiken uit de basisadministratie persoonsgegevens en (inkomens)data op persoonsniveau. Zo kan men ook (beter) zicht krijgen op armoede bij werkende mensen. Ook wordt er zo inzicht verkregen in de vraag met welke aspecten armoede samenhangt, en in welke mate. Een ander voorbeeld is dat van big data onderzoek naar de effectiviteit van re-integratieprojecten van het Erasmus MC.”

Wat zijn andere dingen die jullie opvallend vonden?

Ruud: “Eigenlijk verkeert men vooral nog in de fase dat men bezig is om te leren wat je met big data kunt. Het gaat vooral nog om pilots. Opvallend is ook dat de onderzoekers die bezig zijn met big data aangeven dat het zoeken naar patronen zonder vooraf opgestelde hypotheses eigenlijk weinig zin heeft. Er moet wel een beginvraag zijn, zeggen ze, een idee van wat je zou kunnen vinden. En dan gaat het er om data bestanden te zoeken, waarmee die vraag of hypothese mogelijk verder gebracht kan worden. Eigenlijk lijkt dat veel op de ‘traditionele’ manier van onderzoek doen.”

Wat is jullie conclusie over de beloften van big data voor preventie en lage ses?

Ruud: “. We denken dat de hoge beloften van big data, voor preventie en lage ses, niet realistisch zijn. Als het gaat om gepersonaliseerde zorg is er misschien wel sprake van beloftevolle ontwikkelingen voor de praktijk, maar dan praat je vooral over toepassingen binnen de medische praktijk. Op het terrein van preventie en gezondheid, en zelfregie, gaat het om het tussengebied tussen de medische wereld en de dagelijkse leefwereld, en dat is niet hetzelfde. Daarbij: er is al veel bekend over de relatie tussen gezondheid en onderliggende oorzaken. En wil je aan preventie doen, dan moet je wel werken aan de factoren die gezondheidsproblemen veroorzaken.” Lydia: “Dat wil zeggen, als een analyse al nieuwe inzichten oplevert, dan is het nog een hele stap naar maatregelen die gericht zijn op feitelijke preventie. En nog meer stappen tot daadwerkelijke preventie. Denk ook aan pogingen om mensen minder te laten roken of beter te laten eten. Je kunt mensen met allerlei informatie en tips bestoken, maar dat leidt niet zomaar tot gezondere gewoonten. Juist in de stap naar gedrag ligt dus nog een hele uitdaging.”

Ruud: “Een apart vraagstuk rond big data betreft de privacy. Je mag persoonsgegevens niet zomaar hergebruiken, hoe goed het beoogde doel ook is. Bedrijven als Google of Apple hebben het dan makkelijker dan organisaties als het RIVM of CBS. Want mensen die online zijn of data verzamelen via hun iPhone, geven vaak snel toestemming voor het gebruik van hun data, zonder daarover goed na te denken. Maar publieke organisaties worden kritisch gevolgd en moeten aan zwaardere eisen voldoen. Dat levert ook een rem op hergebruik van data.”

Beide: “De conclusie van de discussiebijeenkomst met experts die we organiseerden was dan ook dat big data onderzoek waarschijnlijk wel een bijdrage kan leveren aan preventie van zorg of het voorkomen van gezondheidsproblemen bij mensen, maar dat die bijdrage bescheiden zal zijn.”