We kunnen geen servers blijven bijbouwen om de biljoenen gigabyte aan digitale informatie op te bewaren. Op de polymeermolecules van chemicus Steven Martens kan het veel compacter.
Toen Steven Martens vijf jaar geleden aan zijn doctoraat begon, was hij nog een rasechte chemicus. Hij onderzocht polymeersystemen – eenvoudige macromoleculen die je terugvindt in onder meer plastics en DNA. Zijn doel was om daar nieuwe structuren mee te maken. Tot hij in het derde jaar van zijn doctoraat ontdekte dat die structuren zich prima konden lenen tot een welbepaalde functie: informatie opslaan.
Steven Martens
Steven Martens (1989) studeerde chemie aan de Universiteit Gent. Nadat hij in februari zijn doctoraat over polymeerstructuren verdedigde, ging hij als postdoc aan de slag in de faculteit Farmaceutische Wetenschappen. Daar legt hij zich toe op kankerbestrijding en immunotherapie. Zijn onderzoek naar dataopslag in macromoleculen wordt verdergezet aan de UGent, onder leiding van polymeerchemicus Filip Du Prez.
Eerder al had Martens met bovengemiddelde belangstelling in het vakblad Nature een paper gelezen over alternatieve informatieopslag. Britse bio-informatici waren erin geslaagd sonnetten van Shakespeare en een stukje van de ‘I have a dream’-speech van Martin Luther King te encoderen in de basenparen van DNA.
Het experiment was een ontzettend belangrijke proof of concept: de wetenschappers hadden het ‘m geflikt om digitale informatie in de vorm van nulletjes en eentjes op te slaan op een drager die zo klein is dat je hem met het blote oog niet eens kan zien. De mogelijkheden die dat met zich meebrengt, zijn fenomenaal. ‘Ik herinner me dat ik las dat je met een kilogram synthetisch DNA genoeg hebt om alle data in de wereld op te slaan’, zegt Martens.
‘Moleculen zijn veel compactere datadragers dan de harde schijven en usb-sticks waarop we nu bestanden opslaan’
En toen vond hij dat zijn polymeermolecules, in poedervorm, ook zulke microscopisch kleine informatiedragers kunnen zijn. En dat ze veel meer informatie kunnen opslaan dan DNA. ‘Een collega heeft het laatst eens uitgerekend. Op een gram van ons moleculepoeder kunnen we 1,76 keer meer data opslaan dan op een gram DNA.’ Een gigantisch verschil, zeker als je even terugdenkt aan wat je met een kilogram DNA al kan doen.
Duitse held
Martens ging aan de slag. Hij begon synthetische moleculen te bouwen met het idee ze te gebruiken als informatiedragers. Al gauw besefte hij dat dat maar een deel van het werk zou worden. Om informatie op die moleculen te zetten, moest hij ze efficiënt kunnen encoderen. En om ze achteraf weer te kunnen uitlezen, had hij een goede decoderingstechniek nodig.
Gaandeweg ontvouwde zich voor Martens een terrein dat op vele plaatsen grensde aan andere disciplines. Hij en zijn promotor Filip Du Prez schakelden de hulp in van informatici aan dezelfde faculteit van de Universiteit Gent. ‘Zij ontwikkelden een algoritme dat een reeks bits kon vertalen naar moleculenstructuren. Wij pasten daar onze chemie op toe. We bouwden de moleculen in poedervorm en zagen erop toe dat hun structuur zuiver was – je wil niet dat je data van bij het begin corrupt zijn.’
Nu had Martens de moleculen en een manier om er informatie op te bewaren. Maar hij wist nog niet hoe hij die data vervolgens weer van die moleculen moest ontfutselen. Op dat punt klopten hij en Du Prez aan bij biochemici. ‘Met een massaspectrometer lazen ze de data op de moleculen uit als spectrumsequenties. Daarmee gingen we terug naar de informatici, die de sequenties vertaalden naar bits. Daar raakte de cyclus rond.’
Vorig najaar beschreven Martens en zijn collega’s in Nature Communications hun eerste test met de informatiedragende moleculen. Met het driestappenplan dat ze hadden uitgedokterd, waren ze erin geslaagd een QR-code in een molecule op te slaan en terug uit te lezen.
De code linkte naar de Wikipedia-pagina van August Kekulé, een 19de-eeuwse Duitse chemicus die tijdelijk aan de Universiteit Gent heeft gewerkt. ‘Hij beschreef als eerste de structuur van benzeen’, zegt Martens. ‘Dat is een organische structuur, de onze is een synthetische, gemaakt in het lab. Het voelde een beetje alsof we met ons werk een cirkel hadden voltooid waarvan hij het beginpunt had vastgelegd.’
Einde van usb
Het moleculenmodel dat Martens heeft ontwikkeld, zit momenteel in de conceptfase. ‘Voor de test met de QR-code heb ik moleculenstructuren van zes eenheden gemaakt. Om er grotere bestanden op te kunnen zetten, zoals foto’s en video’s, moeten we die structuren langer maken. Dat wordt nog een grote uitdaging.’
Ook de uitleesmethode zorgt in de nabije toekomst voor hoofdbrekens. ‘Telkens als we een molecule met een spectrometer uitlezen, schiet dat instrument de hele molecule kapot’, zegt Martens. ‘Daar nemen we een kleine hoeveelheid van om de data die we zoeken uit te lezen – met enkele nanogrammen hebben we meestal genoeg. Maar ideaal is de methode niet. Op den duur hou je niets meer van je molecule over. Op dat vlak staat het onderzoek naar synthetisch DNA veel verder.’
Toch tonen enkele bedrijven nu al interesse in Martens’ moleculenmodel. Vergeleken bij DNA-opslag heeft zijn poedermethode voordelen die je gewoon niet kan negeren. ‘DNA is een complexe structuur, het is voorlopig nog erg duur om het te maken. Het is ook niet eenvoudig om de data die erop staat uit te lezen, en de structuur laat makkelijk foutjes toe.’ Dat alles is veel minder het geval met de macromoleculen die Martens produceert.
Hoe dan ook bijten de klassieke datadragers in het stof. ‘De harde schijven en usb-sticks waarop we nu onze filmpjes, liedjes en andere bestanden opslaan, bestaan vaak uit zware metalen en zeer zuiver silica’, zegt Martens. ‘De aarde heeft die grondstoffen niet in onbeperkte hoeveelheden voorradig. Om DNA en andere moleculen te maken, hebben we die materialen niet nodig.’
‘En, zoals ik eerder al zei: je kan je data echt veel compacter opslaan.’ Tegen volgend jaar hebben we wereldwijd naar schatting 4,4 biljoen gigabyte aan informatie gegenereerd. Om al die data te bewaren hebben Google, Microsoft en andere spelers megalomane datacenters nodig. Tenzij ze volop investeren in onderzoek naar betere informatiedragers. Zoals dat van de Britse bio-informatici die sonnetten op DNA bewaren, of zoals dat van Steven Martens.