Een nieuw AI-algoritme schrijft wijn- en bierrecensies die klinken alsof ze door menselijke critici zijn geschreven. Ligt manipulatie op de loer?
In de wereld van wijnrecensies is het belangrijk om beeldend te schrijven. Denk maar eens aan het volgende: ‘Terwijl de neus een beetje gesloten is, zit het gehemelte van deze niet-droge Riesling boordevol sappige witte grapefruit- en mandarijnsmaken. Het is geen diep geconcentreerde wijn, maar hij is netjes in evenwicht door een vleugje citroen-limoenzuur dat blijft hangen.’
Als je de beschrijving leest, voel je bijna het koele glas zweten in je hand en proef je een uitbarsting van citrus op je tong. Maar de schrijver van deze recensie heeft die ervaring nooit gehad - omdat de schrijver een stuk software was.
Een interdisciplinaire groep onderzoekers ontwikkelde een algoritme dat in staat is om recensies over wijn en bier te schrijven die meestal niet te onderscheiden zijn van die van een menselijke criticus. De wetenschappers publiceerden hun resultaten onlangs in het International Journal of Research in Marketing.
Kenners gooien routinematig met woorden als ‘eiken’, ‘bloemig’ of ‘droog’
Het team hoopt dat dit programma in staat zal zijn om bier- en wijnproducenten te helpen grote aantallen recensies samen te stellen, of menselijke recensenten een sjabloon te geven van waaruit ze kunnen werken. De onderzoekers zeggen dat hun aanpak zelfs zou kunnen worden uitgebreid tot beoordelingen van andere ‘ervaringsproducten’ zoals koffie of auto's. Maar sommige experts waarschuwen dat dit soort toepassingen misbruikt kunnen worden.
Theoretisch had het algoritme recensies over van alles kunnen produceren. Maar een paar belangrijke kenmerken maakten bier en wijn bijzonder interessant voor de onderzoekers. Ten eerste, ‘was het gewoon een zeer unieke dataset’, zegt computeringenieur Keith Carlson van Dartmouth College, die het algoritme dat gebruikt werd in de studie mee ontwikkelde. Wijn- en bierrecensies vormen ook een goed sjabloon voor AI-gegenereerde tekst, legt hij uit, omdat hun beschrijvingen veel specifieke variabelen bevatten, zoals de regio, de druif, het ras, de gistingstijl en het jaar van productie. Ook hebben deze recensies de neiging om te vertrouwen op een beperkte woordenschat. ‘Mensen praten op dezelfde manier over wijn en gebruiken dezelfde woorden’, zegt Carlson. Kenners gooien bijvoorbeeld routinematig bijvoeglijke naamwoorden rond als ‘eiken’, ‘bloemig’ of ‘droog’.
Carlson en zijn co-auteurs trainden hun programma met een decennium aan professionele recensies - ongeveer 125.000 in totaal - uit het tijdschrift Wine Enthusiast. Ze gebruikten ook bijna 143.000 bierrecensies van de website RateBeer. Het algoritme verwerkte deze door mensen geschreven analyses om de algemene structuur en stijl van een recensie te leren.
0'en en 1'en
Om zijn eigen beoordelingen te genereren, kreeg de AI de details van een specifieke wijn of een specifiek bier, zoals de naam van de wijnmakerij of brouwerij, de stijl, het alcoholpercentage en de prijs. Op basis van deze parameters vond de AI bestaande recensies voor die drank, haalde daar de meest gebruikte bijvoeglijke naamwoorden uit en gebruikte die om zijn eigen beschrijving te maken.
Om de prestaties van het programma te testen, selecteerden de teamleden één menselijke en één door AI gegenereerde beoordeling voor elk 300 verschillende wijnen en 10 menselijke beoordelingen en één AI-beschouwing voor elk 69 bieren. Vervolgens vroegen ze een groep menselijke proefpersonen om zowel de door de machine gegenereerde als de door de mens geschreven recensies te lezen en controleerden ze of de proefpersonen konden onderscheiden wat wat was. In de meeste gevallen konden ze dat niet. ‘We waren een beetje verrast’, zegt Carlson.
Hoewel het algoritme goed leek te zijn in het verzamelen van veel recensies en ze samen te vatten in een enkele, samenhangende beschrijving, heeft het een aantal belangrijke beperkingen. Het is bijvoorbeeld mogelijk dat het algoritme niet in staat is om het smaakprofiel te voorspellen van een drank die niet is geproefd door menselijke smaakpapillen en beschreven door menselijke schrijvers. ‘Het model kan geen wijn of bier proeven’, zegt Praveen Kopalle, een marketingspecialist aan Dartmouth en een co-auteur van de studie. ‘Het begrijpt alleen binaire 0'en en 1'en.’ Kopalle voegt eraan toe dat zijn team het voorspellend vermogen van het algoritme in de toekomst zou willen testen - door het te laten raden hoe een nog niet beoordeelde wijn zou smaken, en dan de beschrijving te vergelijken met die van een menselijke recensent. Maar vooralsnog zijn menselijke recensenten, althans in de wereld van bier en wijn, nog steeds essentieel.
‘Ik denk dat mensen op veel manieren ongelooflijk makkelijk te manipuleren zijn’
AI die taal genereert is niet nieuw, en soortgelijke software is al gebruikt om aanbevelingen te doen voor online beoordelingsplatforms. Maar sommige sites staan gebruikers toe om door machines gegenereerde recensies te verbergen en een van de redenen daarvoor is dat dit soort taalgeneratie een schaduwzijde kan hebben.
Een AI die recensies schrijft, kan bijvoorbeeld worden gebruikt om positieve recensies synthetisch te versterken en negatieve te overstemmen, of omgekeerd. ‘Een online productbeoordeling kan de mening van mensen echt veranderen’, merkt Ben Zhao op, een expert op het gebied van machinaal leren en cyberveiligheid aan de Universiteit van Chicago, die niet betrokken was bij de nieuwe studie. Met dit soort software kan iemand met slechte bedoelingen ‘een concurrent volledig zwart maken en zijn bedrijf financieel vernietigen’, aldus Zhao.
Maar Kopalle en Carlson zien meer potentieel voor goed dan kwaad in de ontwikkeling van software die reviews genereert, vooral voor kleine ondernemers die misschien niet genoeg tijd of kennis van het Engels hebben om zelf productbeschrijvingen te maken.
We leven al in een wereld die gevormd wordt door algoritmen, van Spotify-aanbevelingen tot zoekmachineresultaten en verkeerslichten. Het beste wat we kunnen doen is voorzichtig te werk gaan, zegt Zhao. ‘Ik denk dat mensen op veel manieren ongelooflijk makkelijk te manipuleren zijn’, zegt hij. ‘Het is gewoon een kwestie van het verschil te identificeren tussen correct gebruik en misbruik.’