Hond of kat? Inzicht in de black box van AI-gedragskeuzemodellen

woensdag 15 juli 2020

Redactie

Gezichtsherkenning bij het nemen van foto’s met je smartphone, zoekmachines op het internet en aanbevelingssystemen op streamingdiensten: artificiële intelligentie beïnvloedt dagelijks onze keuzes, zonder dat we begrijpen hoe dat werkt. Maar als het gaat beslissingen rond overheidsbeleid, moeten de modellen waarop het beleid is gebaseerd wel volledig transparant zijn. Ahmed Alwosheel onderzocht hoe je vertrouwen in artificiële neurale netwerken kunt vergroten wanneer deze worden gebruikt om menselijk (mobiliteits)gedrag te begrijpen. Op 10 juli promoveerde hij op dit onderwerp aan de TU Delft.

Statistische keuzemodellen worden al tientallen jaren gebruikt om keuzegedrag mee te voorspellen in de mobiliteitssector en in andere domeinen. Traditioneel zijn zulke modellen gebaseerd op gedragstheorie, zoals de theorie van de nutsmaximalisatie: het idee dat mensen rationeel zijn en dus altijd zullen kiezen voor het alternatief dat de grootst mogelijke behoeftebevrediging met zich meebrengt. “Bij theorie-gedreven modellen doe je allerlei aannames,” zegt Sander van Cranenburgh, die het onderzoek van Alwosheel als co-promotor begeleidde. “Je gaat er bijvoorbeeld vanuit dat er een vooraf vastgelegde relatie bestaat tussen bijvoorbeeld de kosten of de duur van een reis en het nut dat een bepaald vervoersmiddel oplevert. Dat heeft als grote voordeel dat het heel transparant is hoe je model werkt.”

Black box
Een recente ontwikkeling in het gedragsmodellenveld is het gebruik van modellen die niet theorie-gedreven, maar data-gedreven zijn, ofwel op artificiële intelligentie gebaseerd zijn. “Bij data-gedreven modellen laat je veronderstellingen over hoe mensen keuzes maken achterwege en gaat het model zelf op zoek naar de relaties in de data”, legt Van Cranenburgh uit. “Het voordeel van deze modellen is dat complexe processen er vaak goed mee voorspeld kunnen worden. Een nadeel is dat je niet precies weet waar de voorspellingen van deze data-gedreven modellen op gebaseerd zijn.” Het is dit black box-fenomeen dat het gebruik van data-gedreven modellen in sommige domeinen nog in de weg staat. “Gaat het bijvoorbeeld om het maken van transportbeleid dan moet de overheid wel kunnen uitleggen op basis waarvan bepaalde beslissingen zijn genomen”, zegt Van Cranenburgh.
 

Hond of kat?
Alwosheel laat in zijn proefschrift zien hoe je beter inzichtelijk kunt maken waarop de voorspellingen in artificiële neurale netwerken, gebaseerd zijn. Daarmee wordt het vertrouwen in deze, data-gedreven modellen vergroot, omdat inzichtelijk wordt waarop voorspellingen van het model zijn gebaseerd. Daarvoor pionierde de promovendus met twee methodes. De eerste methode komt uit de hoek van de computer vision, waar AI wordt gebruikt om beelden te analyseren en te begrijpen. “Een systeem dat heeft geleerd om honden en katten te onderscheiden, kun je vragen hoe een archetypische hond eruit ziet. Zit er dan een kattenstaart aan, dan komt dit niet overeen met een menselijk beeld van een hond”, zegt Van Cranenburgh. Vertaal je deze methode naar gedragsmodellen, dan kijk je naar de karakteristieken van een typische OV-reiziger. “Als daar dan uitkomt dat het iemand tussen de 20 en 30 is zonder rijbewijs, dan kun je –als onderzoeker– dat spiegelen aan je menselijk beeld van de OV-reiziger: heeft het model geleerd wat ik had verwacht dat het zou leren?” 

De tweede methode kijkt niet naar het model als geheel, maar naar specifieke voorspellingen met behulp van layer-wise relevance propagation (LRP). LRP pelt als het ware alle lagen van de voorspelling af en kijkt zo terug door het netwerk naar de belangrijkste verklarende factoren die van invloed waren op de voorspelling.

 Rijkere voorspellingen
“Met zijn onderzoek heeft Ahmed Alwosheel ervoor gezorgd dat we nu tools hebben die inzichtelijk maken wat er in zo’n data-gedreven model gebeurt. Daarmee wordt het vertrouwen in deze modellen vergroot, en dat maakt dat het gebruik van deze modellen voor het maken van bijvoorbeeld transportbeleid een stap dichterbij komt”, stelt Van Cranenburgh. “Dat is winst, want met een data-gedreven model kun je rijkere voorspellingen maken. Het wordt niet beperkt door de restricties over keuzegedrag die de onderzoeker oplegt; zodoende kan het model allerlei (nog niet bekende) gedragsfenomenen oppikken.”

Uiteindelijk wil Van Cranenburgh theorie-gedreven en data-gedreven modellen dichter bij elkaar brengen om keuzegedrag beter te leren begrijpen en voorspellen. “We hebben nu twee modelleerparadigma’s, die beide goed zijn in iets anders. De uitdaging is om manieren te vinden zodat ze elkaar kunnen versterken”  

De promotoren van Ahmed Alwosheel zijn Caspar Chorus en Sander van Cranenburg

Link naar het proefschrift 'Trustworthy and explainable artificial neural networks for choice behaviour analysis' van Ahmed Alwosheel in de TU Delft repository: https://doi.org/10.4233/uuid:82fcb7b1-153c-4f6f-9d8c-bbdc46cc2d4e

Black box Sh

Foto Shutterstock

mail_outline

Aanmelden voor de nieuwsbrief

Reactie plaatsen

Beperkte HTML

  • Toegelaten HTML-tags: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd> <h2 id> <h3 id> <h4 id> <h5 id> <h6 id>
  • Regels en alinea's worden automatisch gesplitst.
  • Web- en e-mailadressen worden automatisch naar links omgezet.
  • Lazy-loading is enabled for both <img> and <iframe> tags. If you want certain elements skip lazy-loading, add no-b-lazy class name.