Prévisions reposant sur l'IA: Malédiction ou bénédiction?
Une théorie scientifique se révèle juste lorsqu’elle permet de réaliser des pronostics fiables sur des situations ou événements futurs. On crée un modèle du monde et on en déduit des prévisions que l’on teste. Comprendre pourquoi une chose se produit est une autre histoire. Une sorte de compréhension du monde qui restera peut-être toujours inaccessible à l’IA. Mais ce qu’elle sait très bien faire, c’est traiter les données.
L’IA est souvent assimilée aux GPT (generative pre-trained transformers) et autres modèles génératifs. Pourtant, les récents succès de l’apprentissage automatique et de l’IA sont bien plus significatifs que ne le laisse supposer cet engouement. En effet, le secret derrière les progrès des modèles linguistiques, qui étonnent même les spécialistes, n’est rien d’autre que leur capacité à anticiper. Ces réseaux neuronaux d’une taille indescriptible n’ont pas, à vrai dire, résolu le «problème» du langage. Ils parviennent simplement bien mieux que leurs prédécesseurs à deviner la suite la plus probable d’une phrase. Ce qui nous étonne tant, nous les humains, n’est «que» le résultat de la prédiction du mot suivant.
Les modèles linguistiques apprennent aussi des images
«Mais trouver le mot suivant exact est une tâche assez difficile», objecte Robert West, professeur assistant en informatique à l’EPFL, où il dirige le Data Science Lab (dlab) et étudie de tels modèles linguistiques. «Il faut comprendre un peu le monde pour y parvenir.» Ce qui nous amènerait déjà au cœur de la grande controverse qui marque actuellement le monde de l’IA: ces modèles linguistiques sont-ils peut-être un peu plus que de simples modèles de langage? Depuis peu, ces modèles n’apprennent pas seulement le langage ou les images, mais tout à la fois. «La saisie d’images améliore le système linguistique. Un modèle renforce l’autre», explique R. West. Ces modèles «multimodaux» pourraient alors effectivement apprendre des choses rien qu’en observant. A titre d’exemple, R. West cite le simple fait que «lorsqu’on lâche une chose, elle tombe par terre».
Et que se passe-t-il si l’on équipe les robots de tels systèmes? «L’intelligence humaine est ancrée dans le monde physique», poursuit R. West. Les enfants sont de véritables petits scientifiques, ils apprennent en faisant des essais et des erreurs, tout comme nous, les adultes. Les machines en seraient capables elles aussi. En tout cas, elles sont déjà en mesure de soulager les scientifiques en chair et en os d’une grande partie de leur travail.
«Langage de la nature» comme modèle
Modéliser, tester, valider. Siddhartha Mishra, professeur à l’ETH Zurich, connaît bien cette triade scientifique. Ce mathématicien et expert en apprentissage automatique travaille depuis longtemps à apprendre ce type d’analyse aux machines. S. Mishra s’est spécialisé dans les équations différentielles partielles, un outil mathématique qui permet de décrire de nombreux processus naturels. Il désigne celles-ci comme le «langage de la nature». Mais comprendre ce langage et travailler avec lui est bien plus complexe que ce que ChatGPT et consorts accomplissent. En fin de compte, le langage humain contient une version fortement comprimée du monde. «La nature est beaucoup plus sauvage et le défi de modéliser ce système est donc bien plus grand. D’un autre côté, nous avons déjà une bien plus grande connaissance de la nature, et il nous faut désormais l’intégrer aux modèles.»
Jusqu’ici, les calculs comprenant des équations différentielles partielles auraient rapidement nécessité la puissance de calcul d’un superordinateur. Avec l’IA, ces problèmes sont résolus beaucoup plus facilement. Par exemple, S. Mishra a développé avec une équipe de recherche de l’Empa des algorithmes rapides pour la simulation de procédés de fabrication au laser pour l’impression 3D. Avant, une simulation prenait quatre heures. L’IA y parvient en quelques microsecondes. Cela signifie qu’il est possible de simuler et d’imprimer en temps réel. L’utilisation d’équations différentielles partielles est également courante dans les systèmes d’alerte précoce aux tsunamis. L’approche de S. Mishra pourrait sauver des vies si elle permet de calculer rapidement la simulation des événements attendus à la suite d'un tremblement de terre.
Scénarios de politique énergétique
Philipp Heer, responsable du domaine de l’IA dans le secteur de la construction et de l’énergie au Digital Hub (dhub) de l’Empa, décrit un cas similaire. Outre les problèmes d’optimisation classiques, p. ex. comment chauffer une maison le plus efficacement possible, l’IA est utilisée ici entre autres pour calculer des scénarios de politique énergétique pour la Suisse. Quelle question de confiance se pose si les machines nous disent à l’avenir quel type de politique nous devrions mener? Ph. Heer est d’avis que l’IA ne fait pas fondamentalement autre chose que les spécialistes humains, mais qu’elle le fait beaucoup plus rapidement. «Le résultat serait semblable si dix scientifiques étudiaient le problème pendant dix ans.» Avec les systèmes actuels, il est désormais possible de modéliser un nombre bien plus grand de scénarios.
Nowcasting des inondations urbaines
João P. Leitão, chef de groupe dans le département Gestion des eaux urbaines de l’Eawag, ne parle pas dans ce contexte de forecasting, mais de nowcasting. Prévoir les crues urbaines après de fortes pluies n’est possible que grâce à l’utilisation de modèles d’IA. Auparavant, les ordinateurs devaient tourner pendant des heures pour obtenir des simulations à haute résolution similaires; les éventuelles alertes arrivaient alors trop tard.
Cela nous incite à avoir des idées de science-fiction. Pourra-t-on tout simuler dans un avenir proche? L’IA sera-t-elle capable de calculer l’évolution future de n’importe quelle suite de données? Les modélisations physiques ne connaissent pas encore une trajectoire aussi fulgurante que ChatGPT, comme le précise S. Mishra: «Nous n’avons pas encore ce moment magique.» Mais qui peut dire où nous allons, vu la vitesse à laquelle les choses se passent? Il est dans tous les cas rempli d’espoir et d’optimisme. «D’une certaine manière, le grand objectif de mes recherches est le suivant: une IA qui fait paraître la modélisation de la nature aussi simple que GPT le fait pour la modélisation du langage.»
R. West pense lui aussi que les modèles actuels peuvent faire bien plus que simplement générer des résultats linguistiques. «Ils sont utilisés comme prédicteurs de mots suivants. Mais la prédiction ne doit pas nécessairement concerner des mots.» Avec la base de données correspondante, cela fonctionne également avec les transactions par carte de crédit ou avec des comportements en ligne, et même avec les séquences génétiques.
Prévisions de la croissance du plancton
Modèles et success stories tous azimuts. À cet égard, Marco Baity Jesi adopte un point de vue plus terre-à-terre sur les développements actuels. Le physicien étudie à l’Eawag des approches appliquées et théoriques de l’IA, par exemple pour simuler la croissance du plancton dans les lacs. Mais les gros avantages sont évidents: l’IA permet de traiter de grandes quantités de données, de modéliser les choses, même si au fond on ne sait pas vraiment «comment elles fonctionnent», et de faire des prévisions. «Nous avons tendance à tomber trop facilement amoureux de nos modèles.» Et souvent, il n’est justement pas si facile de valider les résultats. Mais cette force nous invite aussi à la prudence: l’avenir reste toujours incertain, toute prévision est juste jusqu’à un certain point. Il déplore l’absence de voix critiques dans la communauté de l’IA et rappelle l’importance d’évaluer la fiabilité des prédictions.
Détection d’erreurs systématiques
Konrad Bogner du WSL connaît lui aussi le phénomène. C’est un vétéran dans le domaine des prévisions de l’IA. L’hydrologue déclare avoir déjà travaillé avec des réseaux neuronaux il y a vingt ans pour sa thèse de doctorat afin de modéliser les débits, par exemple après des intempéries. Si personne ou presque n’avait entendu parler de ce terme à l’époque, aujourd’hui, tout le monde s’essaie à l’IA. Si ce mot à la mode permet de vendre plus facilement ses propres travaux scientifiques, il est important de considérer qu’il y a un avantage réel à tout cela. Il existe des domaines d’application qui peuvent tout aussi bien être modélisés avec des moyens plus simples. Si l’on utilise l’IA de manière aussi différenciée, elle recèle alors un grand potentiel, comme l’explique K. Bogner. Ainsi, les modélisations de l’IA pourraient aider à détecter les erreurs systématiques dans les prévisions. Concernant les modèles linguistiques, on connaît ce phénomène sous le nom de «biais»: les modèles ne sont pas neutres, ils ont repris nos préjugés. Cela peut aussi être le cas en météorologie et en hydrologie, et peut aiguiser notre regard sur les points faibles des modèles traditionnels.
S. Mishra pense que c’est justement cet «ancrage» qui fait la force des modèles qui modélisent la nature, contrairement à ChatGPT et consorts, qui eux tentent de maîtriser le concept plutôt flou de langage. «Dans la nature, la ‹vérité› est très bien définie.» Les prévisions en sont un bon exemple. Nous le faisons depuis longtemps et avons de ce fait déjà une grande expérience pour tester la précision des modèles. Et s’il ne s’agit pas de phénomènes naturels, mais d’un diagnostic médical? Allons-nous développer dans ce cas la même confiance fondamentale? S. Mishra ne tarde pas à répondre: «Je ferais d’emblée confiance à un système d’assistance automatique.» Sa femme est médecin, et il est convaincu qu’elle et ses collègues ne pratiquent rien d’autre qu’une sorte d’apprentissage automatique. «Beaucoup de gens ne sont pas conscients du fait que le corps médical travaille aussi avec des modèles, faisant constamment des approximations de la vérité.» C’est pourquoi la combinaison de l’approche humaine et de l’approche algorithmique est pour lui une évidence.
Dépistage précoce du cancer
Le PSI étudie actuellement comment cela pourrait se traduire dans la pratique. G.V. Shivashankar, directeur du Laboratoire de biologie à l’échelle nanométrique au PSI et professeur de mécano-génomique à l’ETH Zurich, utilise l’IA de reconnaissance d’image pour extraire des informations médicales pertinentes de cellules sanguines spéciales.
Ce qui a en fait été développé pour identifier des objets dans des photos aide à reconnaître les processus de vieillissement dans les cellules ou permet le dépistage précoce du cancer. Les chercheuses et chercheurs profitent du fait que l’ADN est «emballé» différemment selon l’état de la cellule, comme peuvent le montrer les procédés de microscopie sensibles correspondants.
Grâce à l’apprentissage semi-supervisé (technique hybride qui utilise des données marquées et non marquées), l’IA est entraînée de sorte à reconnaître avec une grande précision les cellules sanguines dans un corps dans lequel une tumeur se développe. «Notre philosophie a toujours été que chaque cellule est importante pour comprendre la maladie», explique G.V. Shivashankar. Mais suivre les changements cliniquement pertinents au niveau des cellules individuelles est un gros défi, qui ne peut en réalité être surmonté qu’avec l’IA. Il considère que les procédés actuels sont «si puissants» et leur application en médecine si fructueuse que cette interaction donnera naissance à de toutes nouvelles méthodes d’IA. Il est dans tous les cas convaincu que le diagnostic sera bien plus important déjà dans les stades précoces de la maladie que c’est le cas aujourd’hui.
Lʼhomme et la machine
Il est évident que le rapport homme-machine évoluera au cours des prochaines années. Dans le domaine du bâtiment, on a développé une certaines méfiance pour cela depuis longtemps déjà, déclare Ph. Heer. L’automatisation des systèmes de chauffage a clairement montré que nous «aimons garder de l’influence sur notre environnement». Les gens se méfient des systèmes automatiques et autorégulés.
J. P. Leitão pense lui aussi que les processus reposant sur l’IA nécessitent impérativement un contrôle humain. Tels qu’ils sont conçus actuellement, les systèmes d’IA ne disposent pas des capacités humaines cruciales pour prendre des décisions: «Les décisions concrètes doivent toujours être prises par des personnes.»
R. West est convaincu que la renégociation de cette relation ne pourra pas se faire sans réglementation politique et considère les efforts actuels, par exemple au niveau de l’UE, comme «louables». Mais il faut toujours garder à l’esprit le potentiel que recèlent les méthodes d’IA. Il mentionne lui aussi spécifiquement le domaine médical. Mais les défis sont de taille: «Réguler un robot industriel ou une machine à vapeur, ce n’est pas la même chose.» Les modèles d’IA ont selon lui la possibilité de s’améliorer eux-mêmes. «Ils peuvent quasiment ‹aller dans le monde réel› et découvrir par eux-mêmes comment celui-ci fonctionne.» A l’heure actuelle, il est difficile de prévoir ce que cela signifie exactement, et si cela mène à une amélioration exponentielle des modèles. «Si un tel développement devait avoir lieu, alors nous ne pourrons plus en tant qu’êtres humains faire aucune prévision» en ce qui concerne l’avenir de l’IA.
R. West n’est sûr que d’une seule chose pour le moment: «Quelque chose d’important est sur le point d’arriver.» Un large public en a désormais pris conscience avec ChatGPT. «Le langage est si évident parce qu’il est si humain et parce qu’il est possible de représenter tellement de choses avec lui. Mais cela ne s’arrêtera pas là.»