Une IA caméléon pour cataloguer rapidement les objets vus du ciel

Débris flottant sur l’océan, déforestation ou encore cartographie des zones urbaines : un programme permet d’entrainer, sur la base de quelques images seulement, un réseau neuronal qui discrimine très rapidement de nouveaux éléments sur des données issues de satellites ou de drones.

Cécilia Carron 16.01.2024

Étudier des populations d’animaux, quantifier la végétation, mettre en évidence les déchets flottant à la surface des océans, surveiller l’évolution des glaciers…, les images prises par des drones ou des satellites fournissent une mine d’informations inépuisable pour mieux comprendre les phénomènes qui s’opèrent à la surface du globe. Des réseaux de neurones sont capables de repérer et classifier les éléments souhaités après avoir été entrainés par des spécialistes. «Mais aucun programme ne permet de faire passer rapidement l’IA de la reconnaissance d’un débris à celle d’un arbre ou d’un bâtiment», souligne Devis Tuia, professeur de l’EPFL. «Les chercheurs doivent actuellement recommencer l’apprentissage pour chaque nouveau sujet en lui fournissant de grandes quantités de données de terrain». Avec ses collègues du Laboratoire de science computationnelle pour l’environnement et l’observation de la Terre, ainsi que des scientifiques de l’université de Wageningen (NL), du MIT , de Yale et du centre de recherche de Jülich (D), il a développé un système d’apprentissage caméléon, METEOR, capable de passer d’un type d’objet à l’autre sur la base d’une poignée d’images.

«Nous avons développé des algorithmes et des techniques qui permettent aux modèles de généraliser à partir des expériences antérieures et d'appliquer ces connaissances à de nouvelles situations.» Marc Rußwurm

Quatre ou cinq images de bonne qualité suffisent à re-entrainer le système pour une nouvelle tâche

Les tâches de reconnaissance d’images effectuées par des intelligences artificielles de type réseaux neuronaux permettent de faire en un clin d’œil le travail de classification qui prendrait des heures à des humains. Ces programmes se basent sur des données d'entraînement annotées par des humains pour apprendre et améliorer leur précision au fur et à mesure. Un arbre ou un bâtiment par exemple peuvent avoir des représentations très différentes selon la région d’où les données sont tirées. Une grande quantité d’images du même élément pris dans différentes conditions est donc en principe nécessaire pour assurer une bonne fiabilité. «Pourtant pour de nombreux problèmes en sciences de l’environnement, il n’est pas possible d’obtenir un paquet de données suffisamment large. Par exemple lorsqu’il s’agit d’un problème local comme la disparition d’une espèce d’arbres spécifique à cet endroit ou le repérage de débris dans l’océan qui sont partout, mais peu nombreux si on regarde le problème d’un point de vue statistique», constate Marc Rußwurm, ancien post-doctorant de l’EPFL, aujourd’hui professeur assistant à l’Université de Wageningen (Pays-Bas).

L’autre point d’achoppement pour l’apprentissage est l’adaptation de l’IA a des résolutions spatiales et des bandes spectrales différentes, ainsi qu’au type d’appareil (par exemple satellites ou drones). METEOR est un système adaptable, capable de méta-apprentissage: il prend des raccourcis en se basant sur des tâches préalables déjà réussies dans d’autres contextes. «Nous avons développé des algorithmes et des techniques qui permettent aux modèles de généraliser à partir des expériences antérieures et d'appliquer ces connaissances à de nouvelles situations», explique le chercheur. Pour une nouvelle recherche, quatre ou cinq images de bonne qualité suffisent à rendre le modèle suffisamment fiable.

Un modèle qui se joue des différences de résolution

Pour tester les capacités de leur programme, les scientifiques ont modifié une IA existante, entraînée à classifier l'occupation du sol à l'échelle mondiale, pour la rendre capable de résoudre cinq tâches très différentes avec une phase d’apprentissage minimale: repérer la couverture végétale en Australie, différencier des zones de déforestation dans la forêt tropicale au Brésil, détecter les changements survenus à Beyrouth entre avant et après l’explosion qui s’est produite en 2020, repérer des débris marins dans l’océan et classer des zones urbaines en différents types d’utilisation du sol (zones industrielles, commerciales et résidentielles denses, moyennes et peu denses), à chaque fois sur la base d’une petite quantité d’ images, mélangées entre haute résolution et images satellites selon le problème considéré. «Pour ces tâches où le nombre de données est limité, les résultats sont dans tous les cas de figure comparables aux mêmes données traitées sur des programmes longuement entrainés», note-t-il. Dans le futur, les chercheurs souhaitent entrainer l’IA de base sur une multitude de tâches, afin qu’elle perfectionne encore ses pouvoirs de camaléon. Elle pourra ainsi s’adapter encore plus facilement à d’innombrables tâches de reconnaissance. D’autre part, l’intégrer dans un domaine d’interaction avec les humains où ce sont ces derniers qui cliquent sur quelques images de bonne qualité proposées par le système permettrait aussi une amélioration. «Comme le système ne voit que quelques images, la pertinence de ces dernières est très importante», précise Marc Rußwurm.