Het doel van artificiële intelligentie is altijd geweest om machines te maken die menselijke intelligentie simuleren. Toch kan het nastreven ervan onbedoelde negatieve gevolgen hebben.
Hoewel er geen wetenschappelijke consensus bestaat over een definitie van menselijke intelligentie, is het wel duidelijk dat deze multidimensionaal is en zich op verschillende manieren uit. Naast het IQ bestaat er bijvoorbeeld ook een EQ voor emotionele intelligentie. Intelligentie omvat ook verschillende componenten zoals geheugen, perceptie, redeneren en leren, en het vermogen om ons aan te passen aan nieuwe omstandigheden.
Het simuleren van deze veelzijdige capaciteit wordt aangeduid als artificiële algemene intelligentie of AGI (afkorting van het Engelse Artificial General Intelligence).Bij de ontwikkeling van AI wordt er vaak gefocust op specifieke taken waarvoor intelligentie nodig is. Een voorbeeld hiervan is het AlphaGo-algoritme van Google DeepMind, dat de beste Go-spelers kan verslaan. Een ander voorbeeld zijn computer vision-algoritmes die objecten kunnen detecteren.
Deze worden dan getest via benchmarks zoals de ImageNet-dataset, die miljoenen afbeeldingen van verschillende objecten bevat. Voor verschillende van deze taken zijn er inmiddels AI-modellen die beter presteren dan mensen. In de figuur hieronder zijn de resultaten op verschillende benchmarks door de jaren heen vergeleken met de menselijke prestatie (100%). Dit wordt aangeduid als artificiële nauwe intelligentie, omdat deze zich richt op een beperkt deel van het intelligentiespectrum.

Terwijl de meeste mensen zich niet bezighouden met het onderscheid tussen AI en AGI, is dit anders bij de werknemers van technologiebedrijven die AI ontwikkelen. In San Francisco bijvoorbeeld, dicht bij Silicon Valley, is het idee van AGI niet marginaal of exotisch. Men spreekt er over "het voelen van AGI," en het ontwikkelen van AI-systemen die menselijke intelligentie overtreffen is het expliciete doel van enkele toonaangevende bedrijven in Silicon Valley. Zo staat in de missie van OpenAI, het bedrijf achter ChatGPT, dat ze ernaar streven AGI, waarmee ze zeer autonome systemen bedoelen die mensen overtreffen in het meeste economisch waardevolle werk, ten dienste te stellen van de hele mensheid (hoewel OpenAI en Microsoft eind 2024 een overeenkomst zouden hebben opgesteld waarin staat dat OpenAI AGI heeft bereikt wanneer het meer dan 100 miljard dollar aan winst genereert, een definitie die moeilijk te rijmen valt met hun missie). Demis Hassabis, de CEO van Google DeepMind, voorspelde eerder deze maand dat AGI binnen vijf tot tien jaar werkelijkheid zal worden. Dario Amodei, de CEO van Anthropic, het bedrijf achter de chatbot Claude, stelde op de AI Action Summit in Parijs begin februari dat de capaciteiten van AI-systemen tegen 2026 vergelijkbaar zullen zijn met die van een volledig nieuwe staat bevolkt door zeer intelligente mensen.

In het artikel "Stop treating 'AGI' as the north-star goal of AI research" pleiten diverse AI-experts van academische instituten en organisaties zoals Google en Hugging Face ervoor om AGI niet langer als ultiem onderzoeksdoel te zien. Ze stellen dat AGI een omstreden term is waarover geen consensus bestaat, en dat de focus hierop het nastreven van effectieve doelen in de weg staat. Ze beschrijven verschillende valkuilen die versterkt worden door het AGI-narratief, waardoor het moeilijker wordt om hype van realiteit te onderscheiden. Deze situatie wordt verergerd door de razendsnelle ontwikkelingen in het vakgebied, waarbij de afstand tussen fundamenteel onderzoek en een product voor miljarden gebruikers steeds kleiner wordt. We bespreken hier kort de 7 valkuilen uit het artikel:
- Illusie van Consensus: Het wijdverspreide gebruik van de term "AGI" in de media wekt een vals gevoel van overeenstemming over de definitie en onderzoeksdoelen, terwijl er in werkelijkheid grote meningsverschillen bestaan. Deze onkritische benadering verhindert een open discussie over de werkelijke doelen van AI-onderzoek. Net als "de keizer zonder kleren" blijkt het idee van AGI vaak inhoudsloos, wat de problemen van overhype en onduidelijkheid alleen maar versterkt.
- Slechte Wetenschap: Het gebrek aan duidelijke specificatie van doelen en begrippen leidt tot gebrekkig wetenschappelijk onderzoek zonder externe validiteit. De experimentele ontwerpen lijken meer op engineering gericht op het behalen van goede benchmarkscores dan op gedegen wetenschappelijk onderzoek. Voorbeelden van gebrek aan externe validiteit zien we in het onkritische gebruik van termen als "taalbegrip" of "verbeeldingskracht" voor AI-modellen. Ook ontbreekt consensus over de definitie van "intelligentie". Terwijl vakgebieden als psychologie, neurowetenschappen en cognitieve wetenschap al generaties lang onderzoeken wat intelligentie precies inhoudt, hanteert AI-onderzoek vaak definities die vooral geschikt zijn voor benchmarking of marketing, waarbij men profiteert van historisch positieve associaties.
- Veronderstellen van neutraliteit van waarden: Doelen worden vaak voorgesteld als puur technisch of wetenschappelijk, terwijl ze onvermijdelijk politieke, sociale en ethische dimensies hebben. Begrippen als "intelligentie", "gezondheid" en "welzijn" bevatten normatieve aannames over wenselijk gedrag en vaardigheden. Dit leidt tot fundamentele onenigheid over de betekenis van AGI, aangezien deze afhangt van verschillende politieke, sociale en ethische prioriteiten.
- Loterij van doelen: Externe prikkels, omstandigheden en toeval kunnen leiden tot doelen die wetenschappelijk, technisch of maatschappelijk onvoldoende onderbouwd zijn. Zo wordt onderzoek binnen deep learning vooral gestimuleerd door de beschikbaarheid van krachtige parallelle computersystemen zoals GPU's. Het najagen van state of the art (SOTA) prestaties op benchmarks versterkt deze dynamiek verder. Deze benchmarks geven echter vaak geen realistisch beeld van de prestaties van modellen in de praktijk. Het nastreven van zulke doelen wordt meer gedreven door reputatie en financiële prikkels dan door een gedegen wetenschappelijke of maatschappelijke onderbouwing.
- Algemeenheid Schuld: AGI-definities variëren sterk in wat als wenselijke algemeenheid wordt beschouwd. Het begrip 'algemeenheid' kan verschillende betekenissen hebben: de verscheidenheid aan uitvoerbare taken, het vermogen om "elke taak" uit te voeren tegenover het beheersen van vooraf bepaalde taken, de diversiteit in data voor model input/output, prestaties die mensen als 'verrassend' ervaren, of het vermogen om een algemene taal te begrijpen voor de probleemstelling. Deze onduidelijkheid leidt niet alleen tot problemen met wetenschappelijke en technische validiteit, maar roept ook ethische vragen op over welke vormen van algemeenheid we zouden moeten nastreven.
- Genormeerde Exclusie: Het uitsluiten van gemeenschappen en experts bij het vormgeven van de doelen van AI-onderzoek leidt tot minder innovatieve en impactvolle ideeën. Dit probleem manifesteert zich op drie niveaus. Ten eerste worden veel gemeenschappen, vooral gemarginaliseerde groepen, buitengesloten. Dit heeft niet alleen schadelijke gevolgen voor de betrokken mensen, maar ondermijnt ook de kwaliteit en effectiviteit van AI-toepassingen, zoals bijvoorbeeld blijkt uit onnauwkeurigheden in gezichtsherkenningstechnologieën. Ten tweede creëert de uitsluiting van verschillende disciplines kennissilo's en een tekort aan cruciale domeinexpertise, waardoor essentiële maatschappelijke en technische inzichten buiten beschouwing blijven. Ten derde versterken de toenemende verschillen in middelen, waarbij grote technologiebedrijven met hun enorme rekenkracht domineren, de structurele ongelijkheid in AI-onderzoek.
Het streven naar AGI als einddoel van AI-ontwikkeling lijkt meer problemen te creëren dan op te lossen. De zeven besproken valkuilen tonen aan dat een fundamenteel andere aanpak noodzakelijk is. In plaats van een vaag gedefinieerd ideaal van 'algemene intelligentie' na te jagen, zouden we ons moeten richten op de ontwikkeling van AI-systemen met concrete, meetbare maatschappelijke voordelen. Dit vraagt om een inclusieve benadering waarin diverse perspectieven samenkomen, doelen helder worden gedefinieerd, en ethische overwegingen vanaf de basis in het ontwikkelingsproces worden verankerd.