Deep learning: zo herkent een iPhone uw gezicht

Nieuwe technologie, die ‘deep learning‘ mogelijk maakt, helpt de belofte van artificiële intelligentie waar te maken.

Google, Facebook en andere giganten zetten belangrijke stappen bij het ontwikkelen van technologie die van zichzelf kan leren. Hun inspanningen zijn in hoge mate afhankelijk van wat als deep learning bekendstaat.

Gebaseerd op de al decennia oude idee dat computers slimmer zouden zijn als ze meer als het menselijke brein opereerden, bestaan diep lerende netwerken uit laag op laag met elkaar geconnecteerde informatie verwerkende eenheden. Die eenheden noemen we artificiële neuronen. Elk daarvan voert een andere operatie uit op de beschikbare input – bijvoorbeeld het classificeren van een beeld. Het verschil tussen conventionele neurale netwerken en diep lerende, is dat de laatste uit veel meer lagen bestaan.

Deep learning raakt in een stroomversnelling in het midden van de jaren 2000. Dat kon door het werk van drie belangrijke figuren – Geoffrey Hinton van de Universiteit van Toronto, Yoshua Bengio van de Universiteit van Montreal en Yann LeCun van New York University –, maar pas recent begon men ook commerciële toepassingen te ontdekken.

Een voorbeeld is de Google Photos app die in mei is gelanceerd. De software kan alle beelden van een iPhone uploaden, correct de beelden van iemand zijn partner, kinderen en kleinkinderen identificeren, en vervolgens die foto’s in aparte digitale mappen dumpen en van thumbnails voorzien. De software kan dit doordat hij gezichten leerde herkennen aan de hand van miljoenen beelden die door het systeem zijn geanalyseerd. Terwijl een beeld langs alle opeenvolgende lagen van het netwerk gaat, identificeert de software elementen in de beelden met een steeds toenemend niveau van abstractie – tot hij uiteindelijk het hele gelaat in het beeld kan detecteren. Zodra de software met voldoende aangezichten is getraind, kan hij de neuzen en de monden van individuen herkennen op beelden die hij nooit tevoren gezien heeft.

Diep leren kan veel meer dan beelden organiseren. Het kan uiteindelijk een stap zijn naar artificiële intelligentie die intelligent gedrag vertoont dat virtueel niet van dat van zijn menselijke meesters kan worden onderscheiden. In februari rapporteerde een team A.I.-experts van de in Londen gevestigde onderneming DeepMind (in 2014 door Google gekocht voor 617 miljoen dollar) dat ze diep leren hadden gebruikt om een computer te bouwen die zichzelf tientallen videogames leert spelen. Na heel wat oefenen  verslaat de software ervaren menselijke spelers al bij de helft van deze games. Het is een kleine stap, maar het machinetijdperk moet toch ergens beginnen.