Taalgebruik ontmaskert nepartikels
01 september 2014 door Eos-redactieAmerikaanse onderzoekers werken aan software die valse wetenschappelijke papers moet herkennen. Verdacht taalgebruik is de verklikker van dienst.
Amerikaanse onderzoekers werken aan software die valse wetenschappelijke papers moet herkennen. Verdacht taalgebruik is de verklikker van dienst.
Kent u Diederik Stapel nog, de voormalige hoogleraar psychologie uit Tilburg, die in 2011 van zijn voetstuk viel nadat bleek dat hij jarenlang gefraudeerd had in zijn onderzoeken. Enkele wetenschappers van de Amerikaanse Cornell University leggen in PLOS ONE uit hoe ze valse papers als die van Stapel kunnen onderscheiden van echte, aan de hand van het taalgebruik. Zo zou Stapel beduidend meer wetenschappelijke termen gebruiken dan gemiddeld in waarheidsgetrouwe papers.
De onderzoekers beweren dat hun detectiemethode met zeventig procent zekerheid echt van vals kan onderscheiden. Momenteel nemen ze een grote hoeveelheid valse papers onder de loep om hun systeem te toetsen en om de software op punt te zetten.
Meer versterkende woorden
'Liegen is erg stresserend. Die angst sijpelt vaak door in het taalgebruik van de leugenaar', vertelt onderzoeker David Markowitz daarover. Als een president bijvoorbeeld liegt over zijn oorlogsvoering, zal hij minder persoonlijke woorden als 'ik' en 'mij' gebruiken, en vaker woorden als 'angst'. Ook online datingsites werden door het Amerikaanse onderzoeksteam al onder de loep genomen.
De artikelen van Diederik Stapel vormden de ideale testcase voor wetenschappelijke papers. Ze bestudeerden in totaal 49 papers waarvan Stapel de eerste auteur was. In de frauduleuze teksten gebruikte Stapel meer versterkende woorden, zoals 'diepgaand' en 'extreem', en minder afzwakkende termen als 'nogal' en 'enigszins'. Als de onderzoeksmethode ook bij andere valse papers blijkt te werken, kan ze volgens de wetenschappers een handige tool vormen om mogelijk valse onderzoeken te onderscheppen.
Kritiek op het onderzoek
Al klinken er ook kritische stemmen. Zo schrijft de Nederlandse taalkundige Marc van Oostendorp (Universiteit Leiden) op de blog Neder-L dat de 'echte' artikelen opvallend vaak meer coauteurs hebben, wat kan verklaren waarom overdrijvingen als 'extreem' sneller geschrapt worden. Van dergelijke alternatieve verklaringen maken de Amerikaanse onderzoekers geen gewag, zo schrijft Van Oostendorp. (adw)