“Het beschrijven en begrijpen van individu-eel rij- en reisgedrag en van de resulterende verkeer- en vervoerstromen is een empiri-sche wetenschap. Simpel gezegd: kennis van verkeer en vervoer begint en eindigt met data. In die data herkennen we terug-kerende patronen. Op basis daarvan stellen we allerlei hypotheses op en bedenken we theorieën en modellen. Die toetsen we ver-volgens met behulp van nieuwe data en zo is de cirkel rond. We doorlopen die cirkel con-tinu – dat is de wetenschappelijke methode! – en elke nieuwe ronde levert weer nieuwe inzichten op. Inmiddels hebben we daarmee een sterk bouwwerk van theorieën en mo-dellen gebouwd.
Toch kraakt en piept dat bouwwerk hier en daar nog behoorlijk en op sommige plekken ontbreekt zelfs de fundering. Daarom wil ik kort bespreken hoe de vlag er in ons vakge-bied bijstaat en hoe big data ons (veel!) ver-der kan brengen.
Laat ik beginnen met reisgedrag. Om reisge-drag te begrijpen onderzoeken we alle kor-te- en langetermijnbeslissingen die leiden tot vervoer en uiteindelijk verkeer tussen A en B. Er zijn behoorlijk wat theorieën bedacht die voorspellingen doen over hoe we die
be-slissingen maken: waarnaartoe, met welke vervoerwijze, hoe laat en langs welke routes. De oudste veronderstellen dat reizigers rati-onele, alwetende rekenmachines zijn die alle opties naast elkaar leggen en de optie kiezen met het meeste ‘nut’, wat dat ook moge zijn. Gedragswetenschappers hebben inmiddels veel realistischere alternatieven bedacht, zoals ellende-minimalisatie, risicovermij-ding en nog veel meer. Niettemin, al die be-slistheorieën zijn – en ik citeer een Ame-rikaanse collega – “assumption-rich and data-poor”. Als we dus niet op grote schaal individuele data verzamelen over gedrag én context om die beslistheorieën te toetsen, blijven de voorspellingen die we ermee ma-ken op z’n best twijfelachtig.
Dan verkeersafwikkeling. We hebben de dy-namica van files en wachtrijen op snelwegen behoorlijk in de vingers. Mits we voldoende data hebben kunnen we met die macrosco-pische modellen zelfs heel aardige voorspel-lingen doen. Ook van voetgangers begrijpen we de macroscopische dynamica en fenome-nologie redelijk, hoewel het doen van voor-spellingen hier al veel lastiger is: voetgan-gersverkeer is sterk contextafhankelijk. Maar zodra we een niveau dieper gaan, naar individueel rij-, loop- en fietsgedrag, neemt
het aantal theorieën drastisch toe. De mees-te theorieën kunnen één of meer fenomenen beschrijven of zelfs verklaren, zoals voer-tuigvolggedrag of rijstrook wissellen, maar ze gaan weer nat op andere fenomenen. De reden is simpel: we hebben de data (nog) niet om de onderliggende gedragsaannames te verifiëren of falsifiëren. Voor sommige fe-nomenen, waarbij bijvoorbeeld interacties tussen verkeersdeelnemers plaatsvinden, bestaan zelfs helemaal nog geen consistente theorieën.
Ook hier geldt dus: als we niet op grote schaal microscopische data over rijgedrag en context verzamelen om de modellen te toet-sen, blijven de voorspellingen die we ermee maken vooral ‘an educated guess’.
Ik zie dus ongelooflijk mooie kansen voor het gebruik van big data, mits we die combi-neren en fuseren met de data die we al heb-ben en de kennis die al bestaat. Dat is niet alleen van belang voor mijn promovendi, maar voor iedereen die gebruik maakt van modellen om voorspellingen te doen over verkeer en vervoer. Kennis over verkeer en vervoer begint en eindigt met data. Chocola maken van big data begint en eindigt met kennis over verkeer en vervoer.”