Een nieuw algoritme brengt met één muisklik verloren oud-Griekse inscripties weer te voorschijn. Maar is het wel zo makkelijk als het lijkt?
Een team onderzoekers van Oxford University lijkt de Steen van Rosetta van de 21ste eeuw ontdekt te hebben. De inscripties op dit in 1799 ontdekte stuk graniet bleken de sleutel te zijn tot het ontcijferen van hiëroglyfen. Het algoritme Pythia, ontwikkeld in samenwerking met DeepMind (Google), werkt op het eerste gezicht een gelijkaardige lacune weg.
Pythia is vernoemd naar de priesteres die in de oudheid cryptische antwoorden gaf op vragen aan het Orakel van Delphi. Aan de ontvanger om ze verder in te vullen. Het algoritme doet iets gelijkaardigs met oud-Griekse inscripties op hard materiaal: stukken invullen die in de loop der eeuwen verloren zijn gegaan.
Algoritme werkt als menselijk brein
Het algoritme werd hiervoor getraind met meer dan 35.000 bekende oud-Griekse teksten, met daarin 3 miljoen verschillende woorden. Daarin werden stelselmatig eerst letters en dan woorden weggelaten. Pythia pakt dit aan zoals ons brein. Het is opgebouwd uit nabootsingen van de neurale netwerken waarmee onze hersenen patronen herkennen en ontbrekende stukken invullen: op basis van geaccumuleerde kennis over enerzijds grammatica, linguïstiek en historische context, en anderzijds lettervorm en lay-out.
De grote winst is dat Pythia dit significant sneller én correcter doet, concludeerden de onderzoekers uit een vergelijkende test. Het algoritme vervolledigde een aantal teksten in een paar seconden, terwijl een panel eindejaarsstudenten epigrafie er twee uur over deed én met 20% meer fouten. ‘Een bewijs van het potentieel van AI voor de studie van inscripties op steen of metaal,’ stelt Thea Sommerschield, een van de auteurs van de onderzoekspaper.
Mensenwerk blijft nodig
Met één muisklik verloren gegane teksten heropvissen, het moet historici als muziek in de oren klinken. Tot je wat dieper gaat graven dan het juichende resumé voor het grote publiek. Dan blijkt, ten eerste, dat een kleinere foutenmarge allesbehalve betekent dat Pythia de perfectie benadert. Ze had het in 30,1% van de geteste teksten namelijk fout.
Ten tweede: de computer doet niet al het werk. Pythia genereert een lijst van hypotheses, soms tot 20 verschillende. ‘De algoritmische patroonherkenning moet dus nog altijd aan- en ingevuld worden door een expert,’ stelt specialiste prof. Philippa Steele (Cambridge). ‘Pythia reikt puzzelstukken aan, maar een mens moet ze juist leggen. Dat kan uiteraard werken, maar veeleer met summiere tekstjes of lange waarin korte fragmenten ontbreken.’
Classicus en codedeskundige Genevieve Lively (Alan Turing Institute) voegt er – ten derde – aan toe: ‘Pythia is alleen getest op oud-Griekse tabletten. We hebben dus geen idee wat het kan met bijvoorbeeld beschadigde papyrusrollen uit het oude Egypte.’
Bronnen: New Scientist en The Science Times