Dodentocht: statistiek voorspelt waar en wanneer je zal opgeven

Slechts zestig procent van de deelnemers aan de beruchte Dodentocht haalt de eindmeet. Wie wel en wie niet? Steffie Van Nieuland (UGent) ontwikkelde een statistisch model dat op basis van leeftijd, geslacht en startsnelheid de plaats en het tijdstip van opgave voorspelt.

Voor wiskundigen en statistici vormt een massa-evenement als de Dodentocht een gouden kans om een simulatiemodel op te stellen en te testen in een realistische setting. De deelnemers aan de uithoudingstocht – het is voor alle duidelijkheid géén wedstrijd – genereren immers een overvloed aan data. Elke deelnemer draagt immers een piepkleine RFID-tag op zijn startnummer. Die geeft aan een centrale computer door wanneer de deelnemer is gestart, een controlepost is gepasseerd (er zijn er vijftien) en de eindmeet is overgestapt.

Toch geven de tags per individuele wandelaar slechts weinig informatie. De tijd tussen de registraties aan twee controleposten is bijvoorbeeld een indicator van de gemiddelde snelheid, maar deze informatie vertelt niet hoelang een deelnemer bij zo’n post is blijven stilstaan – wat vaak gebeurt, bij een van de posten kun je naast drank en verzorging bijvoorbeeld ook warme maaltijden verkrijgen. Het grote voordeel van de RFID-tags zit ‘m dus in de massale en uniforme toepassing.

De tags gaan al meer dan tien jaar mee. De technologie biedt immers aan de entourage van de deelnemers de gelegenheid om ‘hun’ favoriete wandelaar(s) te volgen – online, en sinds dit jaar ook via een app. Dit gebeurt via speciale trackingsoftware. Na afloop van het event gooien de organisatoren de data niet weg. Hierdoor beschikken ze inmiddels over een gigantische dataset.

In 2015 kwam dat wetenschappers van de Universiteit Gent ter ore, die al langer op zoek waren naar een massa-evenement om hun statistieken en modellen op los te laten. Bio-ingenieur Steffie Van Nieuland, van de vakgroep Data-analyse en wiskundige modellering, was in het kader van haar doctoraat – dat ze later dit jaar zal verdedigen – bezig met het onderzoek naar manieren om met statistische hulpmiddelen orde te kunnen scheppen in massamigraties van mensen, dieren, enzovoort. Het doel? De beweging van individuen voorspellen aan de hand van een wiskundig model, gebaseerd op massaal veel datapunten.

Van Nieuland vroeg en kreeg de trackingdata van zes opeenvolgende edities van de Dodentocht, van 2009 tot 2014. De dataset omvat de passagetijden van niet minder dan 65.552 wandelaars. Bovendien is de data gelabeld volgens geslacht en leeftijd. Alles bij elkaar gaat het om bijna achthonderdduizend datapunten (elke passage van een controlepost door elke deelnemer is een datapunt). Van Nieuland kreeg ook groen licht van de organisatoren om de gigantische berg data te gebruiken voor haar onderzoek. Een klein jaar later had de Gentse doctoranda een gedetailleerd wiskundig model klaar en publiceerde ze samen met haar promotors, Jan Baetens en Bernard De Baets, een wetenschappelijk artikel in het vooraanstaande vakblad Plos ONE.

In het artikel legt Van Nieuland haar model – een spatially explicit model, in vakjargon – van naaldje tot draadje uit. Het leest alsof ze een simulatie van een ‘gemiddelde’ Dodentocht heeft gemaakt. Bovendien vormt haar model, en de onderliggende analyse, een wetenschappelijke primeur. Van Nieuland: ‘Bij mijn weten is dit nooit eerder gedaan voor een massa-evenement op deze schaal.’ Het model laat toe om op basis van slechts drie parameters – leeftijd, geslacht en startsnelheid van een deelnemer – een vrij betrouwbare voorspelling te maken van de plaats en het tijdstip van opgave, en dus van het al dan niet uitstappen van de 100 km.

Op basis van de wandelsnelheid langsheen het eerste deel van het traject (de startsnelheid dus), rekent het model de verwachte gemiddelde snelheid uit langsheen het tweede deel van het traject, enzovoort. Van Nieuland: ‘Voor elk traject baseren we ons telkens op de twee vorige trajecten. We hebben gemerkt dat deze werkwijze de grootste voorspellende kracht heeft. Alle berekeningen gebeuren dus iteratief, en daarom hebben we ook geen simpele formule waarin je de drie parameters gewoon kunt invullen. We leren continu uit de data, en op basis daarvan maken we voorspellingen.’

Nieuwe startprocedure

De organisatoren, de vzw Kadee Dodentocht, waren danig onder de indruk van het werk van de Gentse doctoranda. Ze besloten dan ook haar hulp in te roepen om enkele problemen van de voorbije edities mee te helpen oplossen.

Door de grote populariteit barst de Dodentocht de laatste jaren uit zijn voegen, waardoor de gemeente in Klein-Brabant moeite had om de mensenmassa (wandelaars, maar vooral ook sympathisanten) te ontvangen. ‘De wetenschappers en wij hebben een gezamenlijk doel: inzicht krijgen in de massa om deze beter te kunnen geleiden zodat we onze organisatie erop kunnen afstellen’, vertelt André De Clerck, voorzitter van Kadee Dodentocht. ‘Zo kunnen we onze controleposten efficiënter bevoorraden en onze vrijwilligers doelgerichter inzetten.’

Het evenement is altijd al, sinds de eerste editie in 1968, een lokaal volksfeest geweest. Een feest dat dus noodzakelijkerwijs in het centrum van Bornem moet plaatsvinden. En dat willen de organisatoren graag zo houden, al hebben ze wel de startprocedure gewijzigd. Op 10 augustus, om 21u stipt, zal er voor het eerst gestart worden vanaf twee plekken in plaats van één. De Clerck: ‘We starten nog altijd vanaf het Breeven-sportdomein, maar nu vanuit twee verschillende startplekken die op een boogscheut van elkaar liggen. Bij de vorige edities duurde het soms drie kwartier vooraleer iedereen was vertrokken. Dat willen we nu vermijden.’

Door de nieuwe startprocedure verandert ook de doorkomst doorheen het centrum van Bornem. Tot en met vorig jaar passeerden de wandelaars tweemaal langs het centrum: een keer vlak na de start en nog eens rond elf uur. Zo hadden sympathisanten genoeg tijd om hun deelnemers aan te moedigen. ‘Nu passeren we nog maar één keer langs het centrum, rond een uur of tien’, aldus de voorzitter. Het doel van de nieuwe procedure is vermijden dat een té grote massa zich doorheen de nauwe straatjes van het oude centrum moeten wurmen. ‘Na goed 3 km komen beide groepen dan weer samen.’

‘Volgens ons model ligt de ideale plaats waarop beide groepen weer samenkomen pas op 17 kilometer’, zegt Van Nieuland. ‘Maar organisatorisch is het inrichten van een gescheiden parcours over zo’n afstand moeilijk haalbaar. Voor de lokale horeca is het immers belangrijk dat er in de uren na de start genoeg volk doorheen het centrum wandelt. En de grootste drukte vlak na de start zullen ze hiermee wel kunnen vermijden. Bovendien komen beide groepen samen op een brede weg vlak buiten het centrum, iets wat wij ook vooropstelden in ons model.’

Op termijn willen de organisatoren de controleposten ook uitrusten met een tweede RFID-registratie, zodat ze niet alleen weten wanneer de wandelaars er aankomen, maar ook wanneer ze weer vertrekken (waardoor ze de wachttijden kunnen berekenen). ‘Het is echter dure technologie’, zegt De Clerck. ‘Daarom beperken we de tweede RFID-registratie tot de controlepost op 50 km, waar de wandelaars onder andere van kledij kunnen wisselen en een warme maaltijd kunnen eten. In de komende edities kunnen we de technologie dan misschien uitrollen naar de andere posten.’

Lukt het of lukt het niet? Deze variabelen bepalen je slaagkansen

Het weer? Doet er weinig toe

Tussen 2009 en 2014 lag het aandeel wandelaar dat de eindmeet haalde tweemaal boven de 62 procent. In beide edities was het droog en niet té warm. In de warmste editie (die van 2010) bedroeg het slaagpercentage 61,4 procent – de maximale temperatuur was toen 28 graden.

De Gentse onderzoekster geeft grif toe dat ze een grotere invloed hadden verwacht, vooral van slecht weer. ‘We hadden verwacht dat regen of koude nachten ervoor zouden zorgen dat meer deelnemers zouden afhaken’, zegt Van Nieuland. ‘Maar het weer bleek alleen op korte termijn tot opgaves te leiden. Veel mensen stoppen wel door de koude of de regen, maar toch haalden ongeveer evenveel deelnemers de eindmeet als bij stabiele temperaturen. Slecht weer zorgt er bijgevolg alleen maar voor dat mensen die sowieso zouden opgeven, dat iets vroeger doen.’

Hoe sneller je start, hoe verder je geraakt

Van Nieuland en haar promotors vonden een verband tussen de startsnelheid van elke deelnemer (de gemiddelde wandelsnelheid tijdens het eerste traject) en de slaagkans. Hoe hoger die snelheid, hoe groter de kans dat je de eindmeet haalt. Bovendien concluderen ze dat een gemiddelde wandelsnelheid boven de 5 km/u de slaagkansen gevoelig verhoogt.

50 km: de psychologische grens

Van de ruim tienduizend deelnemers haalt een kleine vierduizend de eindmeet níet. De meesten geven op vlak vóór de controleposten 7 en 8, die halfweg het parcours liggen. Dit is wellicht het gevolg van een combinatie van factoren: de frisse nachtelijke temperaturen, het slaaptekort (om van de uitputting en eventuele blessures nog maar te zwijgen) en het verliezen van compagnons door opgave of door een verschillend wandeltempo – waardoor de morele steun voor elkaar wegvalt.

Uit het model van Van Nieuland blijkt dat 50 km wellicht de belangrijkste psychologische grens is. Wie het tot voorbij de posten 7 en 8 uithoudt, heeft een veel hogere kans om de Dodentocht uit te stappen (75 procent haalt de eindmeet).

Vrouwen geven sneller op dan mannen (maar ze zijn ondervertegenwoordigd)

Zowel bij de mannen als de vrouwen haalt de meerderheid de eindmeet. Bij de vrouwen haakt 47 procent af vóór het einde, terwijl dit bij de mannen 37 procent is. Opvallend: vrouwen wandelen over het algemeen trager en geven daardoor dichter bij de start op, terwijl mannen er pas verder de brui aan geven.

Maar bij deze cijfers hoort een kanttekening, want tussen 2009 en 2014 bedroeg het aantal vrouwelijk deelnemers slechts 23 procent van het totaal. De mannen waren dus oververtegenwoordigd en mogelijk zorgt dit voor een scheeftrekking van de statistiek.

Jong en onbezonnen, ouder en bedachtzamer

Ook de leeftijd heeft een invloed op de slaagkansen, zo blijkt. Jongere wandelaars blijken over het algemeen sneller te starten (wat goed is), maar ze haken ook sneller af. Oudere deelnemers geraken, ondanks hun tragere start, verder. Mogelijk zijn ze beter voorbereid wanneer ze de Dodentocht wandelen. Of ze hebben minder zomerfestivals in de benen.