Moins d’expérimentations animales grâce à l’apprentissage automatique
D’innombrables substances chimiques, dont les engrais et les pesticides, mais aussi des substances pharmaceutiques et des produits chimiques industriels, se déversent dans les eaux souterraines, les lacs et les rivières. «Nous cherchons à savoir quel impact ont les produits chimiques sur les animaux aquatiques, s’ils sont toxiques ou pas», explique Marco Baity-Jesi, responsable du groupe Sciences des données de l’Eawag. Pour cela, on expose dans des bassins des poissons à une substance à différents degrés de concentration. Ces expérimentations animales, mortelles pour les poissons, sont controversées d’un point de vue éthique et, par ailleurs, dispendieuses. «Au lieu de mener ce type d’expérimentations, nous voulons prédire les effets des produits chimiques sur les poissons avec les méthodes de l’apprentissage automatique», explique le physicien. Pour ce projet, son équipe travaille avec le groupe de Kristin Schirmer, qui développe des alternatives expérimentales aux expérimentations sur les poissons à l’aide de lignées cellulaires de poissons.
Pour leur matériau de base, les scientifiques utilisent la banque de données des autorités américaines de protection de l’environnement. Elle contient les résultats d’expérimentations réalisées avec près de 2’200 produits chimiques testés sur 345 espèces de poissons. Au total, les chercheuses et chercheurs ont pu utiliser près de 20’000 entrées. «Ce n’est pas un jeu de données immense, mais cela suffit pour notre projet», déclare le physicien. Après l’analyse et le traitement des données, son équipe a écrit le logiciel pour différents modèles d’apprentissage automatique adaptés à l’objectif recherché. Les scientifiques ont exploité la plupart des données comme matériel d’entraînement et les ont utilisées pour alimenter leurs modèles d’apprentissage automatique. Les chercheuses et chercheurs ont alors réservé une petite partie comme jeu de données test afin d’analyser le niveau de concordance entre les prévisions calculées par la machine et les résultats expérimentaux.
Des prévisions précises
Les chercheuses et chercheurs ont à présent publié leurs résultats dans une première étude. Sur la base des échantillons appris, les modèles peuvent prédire à une vitesse éclair si les produits chimiques sont plus ou moins toxiques pour une espèce de poissons. Les prévisions de l’ordinateur sont juste à plus de 90%. «Les prévisions modélisées ne peuvent pas être tout à fait parfaites, explique Marco Baity-Jesi, car les expérimentations ne le sont pas non plus.» On trouve donc souvent des informations contradictoires sur les expérimentations avec une substance et une espèce de poisson déterminées. «Lorsque l’on procède deux fois à une expérimentation avec la même substance chimique, elle peut être classée dans deux catégories différentes de toxicité», précise le chercheur. «Les modèles ne peuvent pas être meilleurs que les données dont ils apprennent.»
Les autrices et auteurs de l’étude ont été surpris de constater qu’un nouveau modèle, qui donne des résultats probants en toxicologie humaine, ne fournit pas de résultats plus précis que les modèles standards utilisés. «Globalement, nos résultats sont très satisfaisants», estime Marco Baity-Jesi. «Mais bien que nos modèles puissent être utilisés par tout le monde en ligne, de nombreux autres tests sont nécessaires avant que la machine puisse remplacer les expérimentations animales et soit utilisée dans le cadre de la réglementation.»
Des poissons aux invertébrés et aux algues
Les résultats actuels ne représentent qu’une infime partie des produits chimiques et des organismes que nous souhaitons tester. Pour élargir le champ d’application des modèles, il faut un large éventail de données, tant pour l’entraînement des algorithmes que pour leurs tests. Dans l’étape suivante, le groupe de scientifiques veut intégrer à son travail d’autres poissons, mais aussi des invertébrés et des algues. De plus, les données des expérimentations sur les lignées cellulaires de poissons soutiendront les modèles à l’avenir. Le succès des travaux du groupe de Kristin Schirmer a été démontré lorsque l’OCDE a reconnu l’année dernière le test des lignées cellulaires de poissons développé à l’Eawag comme nouvelle directive pour l’agrément de produits chimiques.
«Plus on présente de données aux modèles, meilleurs ils deviennent», explique Marco Baity-Jesi. Il faut également veiller à entraîner les modèles dans le domaine où on veut les utiliser. Si les produits chimiques ou les organismes sont trop différents de ceux testés lors des expérimentations, la précision de l’apprentissage automatique diminue également. Il convient donc d’avoir conscience des limites de sa fiabilité.
Dans certains cas, les prévisions informatiques devront être confirmées par des tests. «Il est donc improbable que l’apprentissage automatique soit à lui seul en mesure de remplacer totalement les expérimentations animales, mais il peut contribuer à fortement les réduire», écrivent les scientifiques. Et Marco Baity-Jesi voit d’ores et déjà une importante possibilité d’emploi des algorithmes informatiques: «Si on dispose par exemple de ressources pour seulement cinq expérimentations, mais des milliers de produits chimiques et d’espèces animales, nos modèles peuvent nous dire quelles substances et quels animaux tester en premier.» L’apprentissage automatique aide donc à fixer des priorités dans la recherche environnementale.