Un réseau neuronal peut lire la hauteur des arbres à partir d'images satellite
L'année dernière a marqué le début de la Décennie des Nations unies pour la restauration des écosystèmes. Cette initiative vise à mettre fin à la dégradation des écosystèmes d'ici à 2030, à la prévenir et, si possible, à réparer les dommages déjà causés. Pour mener à bien ce type de projets, il faut disposer de bases précises, telles que des enquêtes et des cartes de la végétation existante.
Dans une interview, Ralph Dubayah, le chercheur principal de la mission GEDI (Global Ecosystem Dynamics Investigation) de la NASA, explique: «Nous ne savons tout simplement pas quelle est la hauteur des arbres au niveau mondial. [...] Nous avons besoin de bonnes cartes mondiales de l'emplacement des arbres. Car chaque fois que nous abattons des arbres, nous libérons du carbone dans l'atmosphère, et nous ne savons pas quelle quantité de carbone nous libérons.»
Analyser et préparer précisément ce type de données environnementales est la spécialité du laboratoire EcoVision du département d'ingénierie civile, environnementale et géomatique de l'ETH Zurich. Fondé par le professeur Konrad Schindler de l'ETH Zurich et le professeur Jan Dirk Wegner de l'Université de Zurich en 2017, ce laboratoire est le lieu où les chercheurs et chercheuses développent des algorithmes d'apprentissage automatique qui permettent l'analyse automatique de données environnementales à grande échelle. L'un de ces chercheurs est Nico Lang. Dans sa thèse de doctorat, il a développé une approche - basée sur les réseaux neuronaux - pour dériver la hauteur de la végétation à partir d'images satellites optiques. Grâce à cette approche, il a pu créer la première carte de la hauteur de la végétation couvrant l'ensemble de la Terre: la Global Canopy Height Map.
La haute résolution de la carte est une autre première: grâce au travail de Nico Lang, les utilisateurs et utilisatrices peuvent zoomer sur n'importe quelle zone boisée de la planète et vérifier la hauteur des arbres dans une zone de 10m2. Une étude forestière de ce type pourrait ouvrir la voie, notamment en matière d'émissions de carbone, car la hauteur des arbres est un indicateur clé de la biomasse et de la quantité de carbone stockée. «Environ 95% de la biomasse des forêts est constituée de bois, et non de feuilles. Ainsi, la biomasse est fortement corrélée à la hauteur», explique Konrad Schindler, professeur de photogrammétrie et de télédétection.
Formé grâce aux données de balayage laser de l'espace
Mais comment un ordinateur peut-il lire la hauteur d'un arbre à partir d'une image satellite ? «Comme nous ne savons pas quels motifs l'ordinateur doit rechercher pour estimer la hauteur, nous le laissons apprendre lui-même les meilleurs filtres d'image», explique Nico Lang. Il montre à son réseau neuronal des millions d'exemples, grâce aux images des deux satellites Copernicus Sentinel-2 exploités par l'Agence spatiale européenne (ASE). Ces satellites capturent chaque endroit de la Terre tous les cinq jours avec une résolution de 10x10 mètres par pixel. Ce sont les images de la plus haute qualité actuellement disponibles pour le public.
L'algorithme doit également avoir accès à la bonne réponse, c'est-à-dire la hauteur des arbres dérivée des mesures laser spatiales de la mission GEDI de la NASA. «La mission GEDI fournit des données éparses et réparties dans le monde entier sur la hauteur de la végétation entre les latitudes de 51 degrés nord et sud, de sorte que l'ordinateur voit de nombreux types de végétation différents au cours du processus d'apprentissage», explique Nico Lang. Grâce aux données d'entrée et de réponse, l'algorithme peut acquérir lui-même les filtres pour les motifs texturaux et spectraux. Une fois le réseau neuronal formé, il peut estimer automatiquement la hauteur de la végétation à partir des plus de 250'000 images (quelque 160 téraoctets de données) nécessaires à la réalisation de la carte mondiale.
Dans le jargon des spécialistes, le réseau neuronal de Nico Lang est connu sous le nom de réseau neuronal convolutif (CNN). La convolution est une opération mathématique au cours de laquelle l'algorithme fait glisser un masque de filtre de 3x3 pixels sur l'image satellite pour obtenir des informations sur les motifs de luminosité de l'image. «L'astuce consiste à superposer les filtres de l'image. Cela donne à l'algorithme des informations contextuelles, puisque chaque pixel, issu de la couche de convolution précédente, comprend déjà des informations sur ses voisins», explique Konrad Schindler. En conséquence, le laboratoire EcoVision a été le premier à utiliser avec succès des cartes satellites pour estimer de manière fiable la hauteur des arbres, jusqu'à 55 mètres.
Parce que leurs nombreuses couches rendent ces réseaux neuronaux «profonds», cette méthode est également appelée apprentissage profond. Elle a annoncé une révolution majeure dans le traitement des images il y a une dizaine d'années. Toutefois, le traitement de l'énorme quantité de données reste très difficile: le calcul de la carte mondiale de la hauteur de la végétation prendrait trois ans à un seul ordinateur puissant. «Heureusement, nous avons accès au cluster de calcul à haute performance de l'ETH Zurich, nous n'avons donc pas eu à attendre trois ans pour que la carte soit calculée», déclare Nico Lang en riant.
Transparence par l'estimation des incertitudes
Nico Lang n'a pas préparé un seul CNN pour cette tâche, mais plusieurs. C'est ce qu'on appelle un ensemble. «Un aspect important pour nous était également de faire connaître aux utilisateurs et utilisatrices l'incertitude de l'estimation», explique-t-il. Les réseaux neuronaux - cinq au total - ont été formés indépendamment les uns des autres, chacun renvoyant sa propre estimation de la hauteur des arbres. «Si tous les modèles sont d'accord, la réponse est claire sur la base des données d'entraînement. Si les modèles aboutissent à des réponses différentes, cela signifie qu'il y a une plus grande incertitude dans l'estimation», explique Nico Lang. Les modèles intègrent également les incertitudes des données elles-mêmes: si une image satellite est brumeuse, par exemple, l'incertitude est plus grande que lorsque les conditions atmosphériques sont bonnes.
Fondation pour la recherche écologique future
Grâce à sa haute résolution, la carte mondiale de Nico Lang fournit des informations détaillées: «Nous avons déjà découvert des modèles intéressants», déclare Konrad Schindler. «Dans les montagnes Rocheuses, par exemple, les forêts sont gérées en sections fixes, et la forêt tropicale forme également des structures intéressantes qui ne peuvent pas être le fruit du hasard.» Désormais, les écologistes peuvent interpréter ces modèles et données capturés de manière globale.
Pour permettre à cette recherche de se poursuivre, la carte et son code source seront rendus accessibles au public (voir lien ci-dessous). Les premières parties intéressées ont déjà pris contact: Walter Jetz, professeur à l'université de Yale, souhaite utiliser la carte de la hauteur de la canopée mondiale pour la modélisation de la biodiversité. Mais la carte pourrait également intéresser les gouvernements, les administrations et les ONG. «Grâce à Sentinel-2, la hauteur de la végétation peut être recalculée tous les cinq jours, ce qui permet de surveiller la déforestation des forêts tropicales», explique Nico Lang.
En outre, ajoute-t-il, il est désormais possible de valider à l'échelle mondiale des résultats régionaux, tels que la manière dont les couverts de feuilles tropicales agissent comme un tampon climatique. Associée à l'approche des stocks de carbone élevé, qui classe les forêts en fonction de leur valeur en termes de stockage de carbone et de biodiversité, la carte de la hauteur de la végétation constitue une base importante pour le maintien et le renforcement des écosystèmes. Selon les calculs de Nico Lang, la végétation d'une hauteur de plus de 30 mètres ne se trouve que sur 5% de la masse continentale, et seulement 34% d'entre elle est située dans des zones protégées.
La mission GEDI devant s'achever en 2023, l'approche nouvellement développée par Nico Lang offre la possibilité de continuer à cartographier la hauteur de la végétation à l'avenir. Toutefois, la prolongation de la mission GEDI - dont les médias internationaux discutent actuellement - est essentielle pour comparer ses données avec celles des futures missions satellitaires telles que la mission Biomass de l'ESA et calibrer le modèle en fonction des changements.