Apprendre de l'inattendu
Un salaud qui a un geste profondément humain dans un film, un candidat jugé perdant par son cercle de connaissance qui gagne la présidentielle, un ami perdu que l’on croise à l’autre bout du monde… Ces événements surprenants ou nouveaux entrainent une réaction. On dévore l’œuvre du réalisateur, on mesure l’étroitesse de sa bulle sociale, on renoue avec la vieille relation… En résumé, la surprise a provoqué un comportement.
C’est à cette question que s’intéresse le Laboratoire de neurosciences computationnelles de l’EPFL, dirigé par Wulfram Gerstner. Les effets de la surprise ou de la nouveauté sur le cerveau et le comportement ont été largement étudiés en neuroscience et en psychologie. Mais nombre de questions demeurent, comme celle de savoir ce que l’on définit par surprise ou nouveauté et quel est leur impact sur les différentes fonctions cérébrales.
Dans sa thèse de doctorat, qui lui a valu le prix de la Fondation Dimitris N. Chorafas, Alireza Modirshanechi apporte des réponses en faisant appel à l’intelligence artificielle. Agrégeant différentes définitions de la surprise, il a conçu un algorithme qui prédit le comportement face à la surprise ou la nouveauté. Prosaïquement, l’algorithme décrit comme un agent intelligent qui imite l’humain et, soumis aux mêmes expériences, il effectue les mêmes tâches avec les mêmes résultats. «Ainsi, en comprenant l’algorithme, nous pouvons mieux comprendre le fonctionnement du cerveau humain et de la cognition», explique le chercheur. Ce travail ouvre la voie à une meilleure compréhension des processus d’apprentissage, de mémorisation ou de prise de décision.
18 définitions mathématiques de la surprise
Le premier défi consistait à trouver un moyen de définir la surprise pour un agent artificiel intelligent. L'idée est que si un agent artificiel imite les humains, il doit se sentir surpris lorsque les humains se sentent surpris. Reprenant des expériences classiques en études comportementales, le spécialiste en science computationnelle a élaboré une taxonomie de 18 différentes définitions mathématiques de la surprise et de la nouveauté pour un agent intelligent. Par exemple, dans les expériences classiques, un humain lit des phrases où certains mots sont considérés, par les expérimentateurs, comme attendus ou inattendus. Autre test : le sujet entend une séquence de sons répétitifs et, soudain un son aberrant se produit. Ou violer une prédiction – je prédis que A va se produire et B se produit – pour créer une surprise… Les définitions mathématiques nous permettent d'étudier comment les agents artificiels surpris se sentent dans ces situations, ce qui nous aide ensuite à expliquer comment les humains réagissent à ces événements surprenants ou nouveaux.
Par une analyse mathématique, Alireza Modirshanechi, qui poursuit ses recherches à Helmholtz Munich, a étudié les similitudes de ces définitions, leurs différences et les conditions qui les rendent indiscernables. Il a ensuite créé un cadre unifié facilitant la comparaison systématique des diverses méthodes de quantification de la surprise et son influence sur le cerveau. Son algorithme distingue la surprise, considérée comme un modulateur de la vitesse d’apprentissage, et la nouveauté, moteur de l’exploration vers un but.
Prédire l’algorithme sur des humains
«La nouveauté peut être surprenante, mais elle peut aussi être attendue. Par exemple voir pour la première fois une éclipse peut être nouveau, mais attendu parce qu’on en connait la date. A contrario, si votre mère qui vit à l’étranger frappe soudain à la porte, elle n’est pas nouvelle, mais c’est une surprise. Nous avons mathématiquement quantifié cela, explique le chercheur. Et nous pouvons ainsi distinguer que la surprise accélère le processus d’apprentissage, tandis que la nouveauté pousse à l’exploration. Nous pouvons dissocier les signaux dans le cerveau.»
En effet, la seconde étape a consisté à tester les prédictions de l’algorithme sur des humains pour voir si elles étaient cohérentes. En collaboration avec le Laboratoire de psychophysique de l'EPFL, dirigé par Michael Herzog, Alireza Modirshanechi a analysé le comportement et les données d’électroencéphalogrammes (EEG) de sujets humains dans des expériences cognitives. Il a démontré que la surprise et la nouveauté sont des déterminants cruciaux du comportement humain dans des environnements volatils et où les récompenses sont rares. «Nous avons été capables de prédire entre 60 et 80% des décisions que les sujets allaient faire durant les expérimentations», avance le chercheur.
«Le but n’était pas de créer une IA meilleure que l’humain, mais d’en concevoir une qui est plus fidèle à lui afin d’améliorer notre compréhension du cerveau, résume Alireza Modirshanechi. Et de préciser: «Tout le monde sait que, quand on lâche une pomme, elle tombe. Mais Newton a trouvé la formule qui l’explique. C’est un peu notre objectif. Nous avons pu définir l’algorithme qui prédit quand et à quel degré le sujet est surpris et nous pouvons expliquer par quelle équation, l’humain apprend plus vite quand il est surpris.»
Un socle pour la recherche
Cet algorithme constitue un socle pour d’autres recherches. «Par exemple, l’EEG suggère que les personnes atteintes de schizophrénie ont une perspective différente de la surprise de celles des groupes de contrôle. Mais on ne sait pas à quel point leur perspective est différente. Notre formule mathématique permet de savoir dans quelle mesure elle l’est. Peut-être apprennent-ils plus lentement parce qu’ils ne ressentent pas la surprise? Peut-être cherchent-ils moins bien parce qu’ils ne perçoivent pas la nouveauté? On peut désormais se poser ces questions et construire des paradigmes expérimentaux pour tester ces hypothèses.»
Dans d’autres domaines, comme l’éducation, ce socle pourrait permettre d’explorer des pistes pour utiliser la surprise afin de renforcer le processus d’apprentissage ou la mémorisation.
L’autre contribution de ce travail relève de l’IA. «La plupart des algorithmes existants se fondent sur un environnement stable. Mais notre monde est en constante mutation. Nous devons donc intégrer ces signaux de «surprise» pour mettre à jour nos modèles et concevoir des IA plus fiables et plus sûres. C’est le bon moment de se pencher sur ces questions et d’élaborer ces outils», conclut le postdoctorant.