Le maître d'œuvre de l'apprentissage automatique actif
Pour Andreas Krause, l'intelligence artificielle et l'apprentissage automatique sont deux des sujets les plus passionnants de notre époque. Il a contribué à développer et à définir toute une série d'approches, allant des fondements théoriques et mathématiques aux questions pratiques concernant l'interaction entre les humains et les systèmes d'apprentissage.
«Les êtres humains sont très efficaces pour apprendre à résoudre des tâches même complexes», explique Andreas Krause. Il est professeur d'informatique à l'ETH Zurich et l'un des principales et principaux chercheur·ses européen·nes dans le domaine de l'apprentissage automatique, qui évolue rapidement. «J'aimerais comprendre comment nous pouvons permettre aux machines d'apprendre avec la même efficacité", ajoute-t-il.
Andreas Krause a abordé pour la première fois le sujet de l'apprentissage automatique au cours de son master, qu'il a obtenu à l'Université technique de Munich en 2004. Par la suite, pour approfondir les principes, il est allé à l'Université Carnegie Mellon de Pittsburgh, où il a rédigé sa thèse de doctorat sur les questions de collecte optimale d'informations. Après avoir terminé son doctorat en 2008, il est devenu professeur assistant à Caltech à Pasadena en 2009, avant de rejoindre l'ETH Zurich en 2011. Depuis lors, il a également assumé des rôles de direction au Swiss Data Science Center, à l'ETH AI Center et au European Laboratory for Learning and Intelligent Systems, ELLIS.
Pour honorer ses réalisations, il a reçu le prix Rössler 2021 lors de l'événement de remerciement de l'ETH Foundation. «Andreas Krause est un chercheur hors pair et un conférencier dévoué, et pour quelqu'un qui n'en est qu'au début de sa carrière universitaire, il a déjà obtenu un nombre notable de mérites dans l'une des technologies les plus impactantes du 21e siècle», a déclaré le président de l'ETH Zurich Joël Mesot dans son discours.
La fascination des agents d'apprentissage
Andreas Krause est particulièrement fasciné par les questions de collecte optimale d'informations qui nécessitent des formes d'apprentissage efficaces et actives telles que l'apprentissage par renforcement. Le facteur clé ici est de gérer l'incertitude lorsque toutes les informations ne sont pas encore disponibles ou lorsqu'il existe une multitude de solutions alternatives.
Dans l'apprentissage automatique «passif» classique, un algorithme d'apprentissage est entraîné à l'aide de grands ensembles de données pour déduire certains modèles à partir de données annotées par des expert·es - ce qui permet, par exemple, d'identifier une règle de classification qui reconnaît si les photos montrent des piéton·nes ou des panneaux de signalisation. Les méthodes d'apprentissage «actif», quant à elles, décident elles-mêmes des données dont elles ont besoin pour effectuer efficacement la tâche en cours. Par exemple, elles peuvent parcourir un ensemble de données d'images, sélectionner les images qui favoriseront la progression de l'apprentissage et les faire annoter par des expert·es, ce qui permet de gagner du temps et de l'argent et de réduire les erreurs. D'autres méthodes actives proposent des expériences dont les résultats promettent des informations précieuses.
Ces programmes informatiques sont également connus sous le nom d'agents d'apprentissage. «Je suis fasciné par les méthodes d'apprentissage actif, où un agent d'apprentissage décide lui-même des données qui l'aideront à prendre de bonnes décisions», explique Andreas Krause.
La robotique est un domaine dans lequel de telles questions se posent. Andreas Krause l'illustre en utilisant un drone qui apprend à résoudre certaines tâches de manière active par le biais de l'expérimentation. La difficulté réside dans le fait qu'au début, il n'est pas possible de dire exactement ce qui risque de faire tomber le drone en panne et ce qui ne le fera pas. Au début, le drone doit se comporter avec prudence; ensuite, plus il obtiendra et analysera de données, plus il sera en mesure d'agir sans se mettre en danger ou mettre en danger les autres.
Dilemme entre les anciennes et les nouvelles données
Cependant, la collecte active d'informations par un agent d'apprentissage n'est pas un processus trivial. Pour optimiser l'exécution d'une tâche, il doit trouver le bon équilibre entre les données existantes et les nouvelles données qu'il acquiert lui-même.
Ce compromis est ce que les chercheur·ses appellent le «dilemme exploration-exploitation»: si l'agent d'apprentissage décide activement des expériences à mener pour obtenir des données supplémentaires, ses décisions influencent également les données dont il dispose ou non au fur et à mesure de son apprentissage.
Parmi ses réalisations majeures, Andreas Krause a développé la première méthode d'apprentissage mathématique pour laquelle, sur la base de certaines hypothèses, il est possible de prouver qu'elle résout efficacement le dilemme exploration-exploitation, même dans des applications complexes. D'un point de vue mathématique, il s'agit d'une variante de l'optimisation bayésienne, qui sous-tend également l'exemple du drone apprenant tout en évitant de s'écraser, et qui fournit certaines garanties formelles de sécurité dans des conditions spécifiques.
Chercheur et enseignant pionnier et passionné
La recherche d'Andreas Krause est en effet très mathématique. Par exemple, les méthodes d'apprentissage actif peuvent utiliser des fonctions «submodulaires» très spécifiques pour acquérir des données utiles aussi efficacement que possible. Aujourd'hui, le professeur est considéré comme un pionnier qui a introduit l'optimisation submodulaire dans l'apprentissage automatique. Les conclusions d'une publication très influente d'Andreas Krause, datant de l'époque où il était aux États-Unis, ont même débouché sur des applications pratiques dans les réseaux de distribution d'eau, en répondant à la question de savoir où placer au mieux les capteurs afin de garantir une mesure optimale de la qualité de l'eau.
Andreas Krause n'est pas seulement un fin penseur lorsqu'il s'agit des fondements mathématiques de l'apprentissage automatique; il est aussi quelqu'un qui réfléchit à l'impact que ces technologies pourraient avoir sur les entreprises et la société. Pour lui, il est essentiel de s'assurer que les algorithmes ou les règles de calcul qui sous-tendent les procédures d'apprentissage sont fiables, explicables et traçables, et que les résultats, les décisions et les recommandations sont justes et dignes de confiance pour quiconque est concerné.
Et cette conviction, Andreas Krause la relaie dans ses cours. Outre les principes fondamentaux des mathématiques et de l'informatique, il se passionne pour l'enseignement aux futur·es expert·es de l'IA du sens des responsabilités dans l'utilisation des technologies. Le Golden Owl Award que les étudiant·es de l'ETH Zurich lui ont décerné en 2012 pour son enseignement et le fait que plus de mille étudiant·es assistent à son cours «Introduction to machine learning» témoignent de son engagement. Il a également contribué à la conception du programme de master en science des données et du DAS en science des données à l'ETH Zurich; au sein de l'ETH AI Center, il veille à ce que davantage d'aspects entrepreneuriaux soient enseignés afin que les spin-offs puissent de plus en plus mettre en pratique les compétences acquises en matière d'IA.