Big data voor inzicht in de relatie tussen fysieke omgeving en gezondheid

Interview met Frank van Lenthe, Erasmus MC / hoogleraar ruimtelijke diversiteit en ongelijkheid bij de faculteit Geowetenschappen van de Universiteit Utrecht

Frank van Lenthe gebruikte big data in een onderzoek in Spijkenisse om de relatie tussen beweeggedrag en omgeving beter te begrijpen. “We zouden al heel ver komen met het terugdringen van de gezondheidsachterstanden als we de kennis die we nu hebben ook echt toepassen en goed aansluiten op de oorzaken van de problemen zonder de toegevoegde waarde van big data af te wachten. Maar met big data kunnen we misschien verder komen.”

U heeft al een lange onderzoekcarrière achter de rug als sociaal epidemioloog. Wat houdt dat vak eigenlijk in?

Sociale epidemiologie richt zich op sociale factoren die van invloed zijn op de gezondheid, zoals opleidings- en inkomensverschillen en het sociale netwerk. Sinds eind jaren negentig ben ik werkzaam op dit gebied bij het Erasmus MC. Het Erasmus MC heeft geweldige databestanden voor epidemiologen, waaronder een langlopend onderzoek naar de rol van leefomstandigheden voor de gezondheid. Dat heeft een schat aan data opgeleverd, waar ik veel gebruik van kon maken. Dankzij dit soort en ander onderzoek weten we al heel veel over factoren die er wat betreft gezondheid en gezondheidsverschillen toe doen.

U heeft zich door de jaren heen bezig gehouden met allerlei factoren die van invloed zijn op de gezondheid. In Utrecht richt u zich vooral op de omgevingsfactoren. Hoe kwam u uit bij de factor fysieke omgeving

Dat begon in Rotterdam. Er waren grote verschillen in gezondheid tussen bewoners in welvarende wijken en bewoners in minder welvarende wijken. Ook toen we corrigeerden voor opleidingsniveau of inkomensverschillen bleven de verschillen aanzienlijk. Daaruit leidden we af dat er mogelijk sprake was van een omgevingseffect. Daarbij gaat het dan om kenmerken van de leefomgeving, zoals de aanwezigheid van groen, het aanbod van voorzieningen, veiligheid en dergelijken. Dit soort zaken zijn waarschijnlijk vooral van invloed op ouderen en andere kwetsbare groepen. Hier in Utrecht, bij het Healthy Urban Living Centrum, werk ik in een interdisciplinaire omgeving met onder andere geografen. Daar heb ik de gelegenheid om veel dieper in te gaan op verbanden tussen de fysieke omgeving en gezondheid. Big data kunnen daar ook een bijdrage aan leveren, bijvoorbeeld door meer inzicht te verschaffen in oorzaken en mogelijke oplossingen.

U heeft onlangs een onderzoek afgerond waarin u big data hebt gebruikt om de relatie tussen de fysieke omgeving en gezondheid beter te begrijpen. Wat hield dat onderzoek in?

We hebben een onderzoek gedaan naar beweeggedrag van meer en minder kwetsbare ouderen (65 jaar en ouder) in Spijkenisse. Dat beweeggedrag hebben we in verband proberen te brengen met de kenmerken van de ruimtelijke omgeving. Daarvoor hebben we deelnemers uitgerust met GPS en afstands- versnellingsmeters waar ze een aantal dagen mee hebben rond gelopen. Dat leverde heel veel data over feitelijk beweeggedrag op. Die gegevens hebben we gekoppeld aan omgevingsinformatie zoals wegen, fietspaden, bebouwing (woningen, winkels) en groen. Daarnaast deden we interviews met de doelgroep.

Waarom noemt u dit big data onderzoek? En wat heeft het onderzoek opgeleverd?

Ik noem het big data onderzoek vanwege de omvang van de data, het gaat om hele grote bestanden. Bovendien worden verschillende bestanden met elkaar gekoppeld, wat eerder niet gebeurde. Door de omvang van de data zijn ze ook niet meer snel te bewerken of te analyseren, al kan het vast nog veel bigger.

De onderzoeksresultaten lieten niet heel grote verschillen in beweeggedrag in relatie tot de omgeving zien. Wel vonden we enige positieve invloed van de aanwezigheid van wandelstroken bij fietspaden, en van de nabijheid van bebouwing. Dat de onderzoeksresultaten weinig verschillen in beweeggedrag laten zien, heeft waarschijnlijk te maken met het gegeven dat de ruimtelijke verschillen in stedelijke gebieden in Nederland, en dus ook in Spijkenisse, beperkt zijn. Zo is er overal wel een winkel of supermarkt in de buurt waar ook groepen met een lage sociaaleconomische status inkopen kunnen doen. En ook in minder welvarende buurten is nog voldoende groen te vinden. Dat is heel anders dan de situatie in de Verenigde Staten. Dat inzicht is ook de aanleiding geweest het verband tussen de leefomgeving en de gezondheid van oudere mensen in een groot Europees project op te zetten. Op die manier hebben we veel meer variatie, want tussen de deelnemende Europese steden zijn veel grotere ruimtelijke verschillen. Dat kan betekenen dat we tot stevigere conclusies komen, en daarmee tot een stevigere basis voor beleid.

Big data onderzoek is vaak complex en intensief en dus ook kostbaar. Dat roept de vraag op of u dezelfde inzichten niet ook had kunnen krijgen met minder kosten, bijvoorbeeld door mensen direct te vragen naar ruimtelijke barrières en stimulansen?

Dat is een altijd een punt van discussie. Ik denk dat als je het mensen vraagt, je dichter bij de ervaring van mensen komt van wat stimulerend is en wat barrières zijn. Je komt dichter bij de uitkomstmaat. Wij hebben in het onderzoek daarom ook naar de beleving van mensen gevraagd. Maar wil je feiten, feitelijke informatie over bijvoorbeeld de omgeving en over beweeggedrag, dan moet je meten. De hoge kosten hebben overigens voor een belangrijk deel te maken met het inrichten van het technische systeem rond de data: zorgen dat je de juiste data gaat verzamelen, het bijeen brengen van de enorme hoeveelheden data, het mogelijk maken dat de data geanalyseerd worden.

Aanleiding voor dit interview was de grote belofte van big data. Uitgaande van uw kennis en ervaring met big data onderzoek, wat zijn uw verwachtingen van big data onderzoek met betrekking tot gezondheid en lage SES-groepen?

Om te beginnen moet je het doel goed in het vizier houden, namelijk het terugdringen van gezondheidsverschillen. De kennis over de oorzaken van gezondheidsverschillen is sterk toegenomen in de afgelopen jaren. We kunnen al grote stappen zetten met het terugdringen van gezondheidsverschillen als we de kennis die we nu hebben ook echt toepassen, zonder de toegevoegde waarde van big data af te wachten. Maar dan moeten we wel goed aansluiten op de oorzaken van problemen. Daar schort het nu soms aan.

Onze big data verkenning voor Gezond in… leverde op dat de verwachtingen van big data onderzoek naar de relatie tussen lage SES-groepen en zorgpreventie getemperd zouden moeten worden. Fundamenteel nieuwe inzichten worden niet verwacht. Hoe ziet u dat?

Ik ben het wel eens met die visie. Zoals gezegd weten we al veel over oorzaken van gezondheid en gezondheidsverschillen. We zijn nog aan het uitzoeken wat je precies kunt doen met big data. Nieuwe inzichten voor de praktijk liggen nog ver weg.”