Onderzoek is minder baanbrekend dan vroeger, stellen wetenschappers in een nieuwe paper. Moeten we ons zorgen maken?
Foto: 12 december 2014. Vreugde in de controlekamer van de LIGO-detector nadat de interferometer voor het eerst correct werd afgesteld. © Caltech/MIT/LIGO Lab
‘Eureka! Eureka!’ Ik heb het, zou Archimedes hebben uitgeroepen nadat hij in bad was gestapt en had gezien hoe het waterniveau steeg. Ineens besefte de Griekse wiskundige dat het verplaatste volume van een vloeistof gelijk is aan het volume van de vaste stof die erin wordt ondergedompeld. Het inzicht leidde tot het Principe van Archimedes, dat onder meer beschrijft hoe schepen drijven en heteluchtballonnen zweven. Het was een baanbrekend idee.
In een studie die onlangs in het vakblad Nature verscheen, suggereert een team van Amerikaanse wetenschappers dat zulke ideeën steeds zeldzamer worden. Innovatief onderzoek komt vandaag minder voor, stellen ze. Het aantal studies dat fundamentele vragen opwerpt of dat een probleem vanuit een nieuw perspectief benadert, is volgens de onderzoekers aan het dalen.
De wetenschappers bekeken 45 miljoen papers en 3,9 miljoen patenten over een periode van respectievelijk zes en drie decennia. Ze gaven elke paper en elk patent een zogeheten disruptiescore. Om tot die score te komen, stelden ze een metriek op die in rekening brengt hoe een werk wordt geciteerd. Kort gezegd: hoe disruptiever een werk, hoe kleiner de kans dat nieuw onderzoek waarin dat werk wordt geciteerd ook voorlopers ervan aanhaalt.
De auteurs stelden een schaal op van -1 tot 1. Papers en patenten met meer consoliderend onderzoek kregen een score tussen -1 en 0; onderzoek met meer disruptieve resultaten ontving een score tussen 0 en 1. Uit het onderzoek blijkt dat de disruptiescore voor papers tussen 1945 en 2010 is gedaald met 91,9 procent voor sociale wetenschappen (van een gemiddelde score van 0,52 naar gemiddeld 0,04) en zelfs met 100 procent voor natuurwetenschappen (van 0,36 naar 0). Voor patenten is de score tussen 1980 en 2010 gedaald met 78,7 procent op het gebied van computertechnologie en communicatie en met 91,5 procent wat geneesmiddelen betreft.
Conclusie: onze collectieve kennis mag de voorbije decennia dan exponentieel zijn toegenomen, toch is het tempo waaraan innovatie plaatsvindt aan het afnemen.
Wat is innovatief?
Klopt het wel wat de auteurs van de Nature-studie stellen? Ja en nee. ‘De metriek die de auteurs hebben opgesteld heeft absoluut zijn waarde’, zegt ICT-expert Wouter Rogiest (UGent en octrooikantoor Patentales). Toen James Watson en Francis Crick in 1953 aantoonden dat een DNA-molecule de structuur heeft van een dubbele helix, werd eerder onderzoek van Linus Pauling op slag irrelevant. Enkele maanden voordien had die nog geopperd dat DNA een drievoudige helix-vorm had. Watson en Crick bewezen dat Pauling het bij het verkeerde eind had. In verder DNA-onderzoek verdween diens bijdrage naar de marge. Getoetst aan de citatiemetriek krijgt de paper van Watson en Crick dan ook terecht een hoge disruptiescore.
Alleen zegt die metriek – en de disruptiescore die daaruit volgt – niet alles. ‘Voor de ontdekking van de DNA-helix komt de score positief uit, maar voor ander Nobelprijswinnend onderzoek niet’, zegt wetenschapsfilosoof Sylvia Wenmackers (KU Leuven). ‘Dat toont volgens mij aan dat baanbrekend onderzoek niet altijd samenvalt met wat de metriek oppikt. De auteurs van de studie wijzen er dan op dat dat onderzoek op eerder werk steunde. Dat neigt naar een circulaire argumentatie.’
‘De conclusies die de auteurs aan hun onderzoek verbinden, zie je in de praktijk enigszins tegengesproken’, bevestigt Rogiest, die verwijst naar de recente vooruitgang in onder meer blockchaintechnologie en artificiële intelligentie.
‘In 2017 verscheen een studie over het zogeheten Transformer Model, getiteld ‘Attention Is All You Need’. Die paper telt momenteel meer dan 62.000 Google Scholar-citaties. Hij heeft aanleiding gegeven tot onder meer ChatGPT en Dall-E. Als je het mij vraagt, zijn zulke Transformers fenomenaal disruptief. Deze AI-modellen zijn geschikt om in allerlei sectoren een bepalende rol te gaan spelen, en ik verwacht dat ze dat ook zullen doen.’
‘Als je het mij vraagt was de studie die leidde tot ChatGPT, Dall-E en andere AI-modellen fenomenaal disruptief’
Nog een belangrijke kanttekening bij de studie: de disruptiescore daalt weliswaar, maar dat wil niet zeggen dat de totale output aan innovatief onderzoek vermindert. Veel heeft te maken met wat je als innovatief of baanbrekend wil bestempelen, meent Wenmackers.
‘Einstein voorspelde een eeuw geleden dat zwaartekrachtgolven bestaan. De paper waarin hij die voorspelling deed, was zonder meer baanbrekend. Maar dat kun je evengoed zeggen van het experiment met de LIGO-detector, waarmee natuurkundigen in 2016 voor het eerst daadwerkelijk zwaartekrachtgolven registreerden. Innovatie kan net zo goed slaan op methodologische vooruitgang als op theoretische vernieuwing.’
Laaghangend fruit
De studie vindt in ieder geval veel weerklank bij de wetenschappelijke gemeenschap. Dat kan erop wijzen dat veel onderzoekers van oordeel zijn dat er een kwalijke ontwikkeling gaande is binnen de wetenschap. Velen zijn niet tevreden met de zogeheten publish or perish-cultuur aan universiteiten. Onderzoekers worden gewogen op basis van hoeveel papers ze op hun naam hebben staan, en niet zozeer op de kwaliteit daarvan.
‘Bij recentere papers zie je dat er daardoor een zekere inhoudelijke verdunning optreedt’, zegt Rogiest. ‘Dikwijls loont het om bevindingen te spreiden over meerdere papers. Dit onderzoek legt de gevolgen bloot waartoe die cultuur leidt.’
‘Innovatie kan net zo goed slaan op methodologische vooruitgang als op theoretische vernieuwing’
De manier waarop projecten worden gefinancierd en beoordeeld laat weinig ruimte voor onderzoek dat buiten de geijkte paden treedt. ‘Een projectbeurs voor vier jaar onderzoek moedigt niet aan om een volledig nieuwe methode of een radicaal andere theorie te ontwikkelen’, zegt wetenschapsfilosoof Sylvia Wenmackers (KU Leuven). ‘Je hebt dan minder kans om binnen die termijn met gedragen resultaten naar buiten te komen.’
Nog een mogelijke verklaring voor de bevindingen van de Nature-auteurs: alle laaghangend fruit is al geplukt. De tijd dat je een principe kon afleiden uit het fysische gedrag van badwater ligt ver achter ons.
‘Tot op zekere hoogte klopt dat’, zegt Wenmackers. ‘Met elke vondst vandaag elimineer je ogenschijnlijk een toekomstige ontdekking. Maar nieuwe methodes of theorieën stellen je juist in staat andere vragen te formuleren, die wegen openen naar nieuwe ontdekkingen. Kijk maar naar artificiële intelligentie. De vereiste rekenkracht voor die technologie is pas recent beschikbaar en daarmee komen weer nooit eerder geziene fruitsoorten binnen plukbereik.’
Kleine stapjes
Het is dus nog maar de vraag of onderzoek echt minder disruptief wordt. Dan nog is de disruptie die de auteurs in hun studie meten niet noodzakelijk na te streven. Disruptief onderzoek brengt dikwijls een zeker risico met zich mee, vindt Wenmackers.
‘Veel wetenschappers die onderzoek uitvoeren naar artificiële intelligentie en robotica zijn bekommerd om reproduceerbaarheid. Onderzoek op die terreinen vindt heel snel zijn weg naar vakbladen, maar de achterliggende methodes en codes zijn vaak onvolledig gedocumenteerd. Dat maakt het moeilijk om de resultaten te repliceren. Disruptief onderzoek kan je op een fout spoor zetten. En het kan decennia duren voordat je dat inziet.’
Er valt heel wat te zeggen voor wat je bijna het exact tegenovergestelde van baanbrekend onderzoek zou kunnen noemen, vindt Wenmackers. ‘Consoliderend onderzoek, dat eerdere resultaten in vraag stelt of verder analyseert, kan ook innovatief zijn. En als zo’n onderzoek leidt tot innovatie, dan heb je een veel grotere garantie dat die goed onderbouwd zal zijn.’
‘Hoe meer je erover nadenkt, hoe meer je inziet dat heel wat schijnbaar revolutionair onderzoek eigenlijk het resultaat is van jaren of zelfs decennia aan kleine stapjes. Samen maken die misschien nog het grootste verschil.’