Un supercalculateur pour une recherche de pointe durable
Chaque jour, une quantité astronomique de données scientifiques sortent des laboratoires de l’EPFL. À titre d’exemple, les utilisateurs et utilisatrices de SCITAS, la plateforme d’informatique scientifique de l’EPFL, produisent 314'000 giga-octets de données utiles par trimestre, qui doivent être conservées entre cinq et dix ans.
Sans infrastructures informatiques de pointe, il serait impossible de traiter ces données de manière efficace. Mais si la puissance des supercalculateurs ne cesse d’augmenter, leur empreinte carbone n’est pour autant pas sur une pente descendante. Le développement d’infrastructures aussi puissantes que peu énergivores est donc au cœur des priorités.
Un supercalculateur de l’EPFL sur la scène internationale
C’est pour répondre à ce besoin que SCITAS a conçu, développé et continue d’exploiter Kuma. Ce supercalculateur permet aux chercheuses et chercheurs un accès privilégié à des équipements de calcul à haute performance à la fois puissants et écoresponsables, offrant une interface intuitive et orientée vers les utilisatrices et utilisateurs. Le cluster Kuma est hébergé dans le centre de données rattaché à la Centrale de chauffe de l’EPFL, qui utilise l’eau du lac Léman pour refroidir les serveurs puis chauffer le reste du campus.
«Grâce à Kuma, l’EPFL continue de renforcer sa présence dans le domaine de l’intelligence artificielle et du calcul durable à l’échelle mondiale», explique Gilles Fourestey, Directeur opérationnel de SCITAS. «La puissance de calcul élevée de Kuma permet d'accélérer l’innovation dans les domaines du calcul scientifique traditionnel, notamment dans des applications majeures en santé, en climatologie, science des matériaux et dans d’autres domaines critiques», ajoute Michele Ceriotti, Directeur du comité de pilotage scientifique de la plateforme.
Ce projet est le fruit d'un partenariat avec Lenovo et le centre de calcul durable EcoCloud de l'EPFL. L'infrastructure de calcul et de stockage a été acquise auprès de Lenovo, qui assurera le support technique tout au long de la durée de vie du superordinateur. EcoCloud a soutenu le développement de l'infrastructure de surveillance pour mesurer précisément la puissance du superordinateur et caractériser son efficacité énergétique.
«Pour EcoCloud, cette collaboration avec SCITAS était une belle opportunité d'appliquer les recherches de l'EPFL sur l'informatique durable à la conception de superordinateurs de pointe qui peuvent être utilisés dans notre nouveau centre de données», explique David Atienza, ancien directeur scientifique du centre EcoCloud et vice-président associé pour les centres et les plateformes à l'EPFL. «C'est un excellent exemple du travail d'équipe entre la Vice-présidence associée pour les centres et les plateformes (AVP-CP) et la Vice-présidence des opérations (VPO) pour concevoir des infrastructures informatiques durables. De plus, l'excellent résultat du classement Green500 nous donne à toutes et tous une motivation supplémentaire pour poursuivre cette collaboration.»
Un mélange de puissance et d’efficacité énergétique
Sur la scène internationale, Kuma se distingue par ses performances puisqu’il occupe la 23ème position dans le classement mondial Green500, atteignant même la 10ᵉ place parmi les systèmes exclusivement académiques. C’est la première fois que l’EPFL se positionne dans ce classement, qui reconnaît l’efficacité énergétique des supercalculateurs. Kuma se classe également à la 103ème place dans le classement Top500 des supercalculateurs les plus puissants au monde, marquant le retour de l’EPFL dans ce classement après huit années d’absence. Cette double reconnaissance positionne Kuma comme l'une des plateformes de calcul scientifique les plus performantes et écologiques à l’échelle mondiale.
Basée sur 334 cartes graphiques NVIDIA de dernière génération, distribuées dans 84 serveurs interconnectés par un réseau de très haut débit (400 Gbit/s), la partition H100 du cluster Kuma a une consommation de 18 watts par TFLOPS1. En comparaison, le cluster IZAR, son prédécesseur en production entre 2020 et 2024, nécessitait environ 81 watts par TFLOPS.
Moins de 90 jours se sont écoulés entre la livraison de Kuma et sa mise à disposition aux utilisatrices et utilisateurs, un exploit remarquable dans ce domaine. Antonio J. Russo, responsable des systèmes HPC chez SCITAS, s’en réjouit: «Ce résultat témoigne non seulement de l'excellente collaboration entre l’EPFL et Lenovo, mais aussi de la capacité de SCITAS à maîtriser et déployer rapidement un large catalogue de logiciels scientifiques grâce à l'efficacité des pratiques DevOps. Il reflète également la coopération très efficace entre les différentes plateformes et centres de recherche de l'EPFL, en particulier SCITAS et EcoCloud.»
Un atout de plus pour l’écosystème de calcul à haute performance suisse
L'acquisition de Kuma s'inscrit dans le plan de la Confédération qui vise à maintenir la Suisse à la pointe des capacités de calcul dédiées à la recherche scientifique. Cette initiative reflète l'engagement durable de la Suisse à garantir à ses scientifiques l'accès aux outils de calcul les plus puissants, soutenant ainsi son leadership international en matière de recherche.
Kuma renforce l'écosystème suisse du calcul de haute performance et fournit aux chercheuses et chercheurs de l'EPFL une nouvelle ressource informatique puissante. Ce cluster vient complémenter le supercalculateur Alps, récemment inauguré au Centre national suisse de calcul scientifique (CSCS) à Lugano. Alps, une infrastructure de recherche nationale, est également basée sur la dernière génération de cartes graphiques NVIDIA, répondant aux exigences les plus élevées en matière de calcul et de traitement des données et contribue à la stratégie nationale de la Suisse en matière d'IA. Kuma et Alps renforcent l'infrastructure nationale de recherche, offrant aux scientifiques suisses des outils uniques pour relever des défis scientifiques à grande échelle.
Que devient l’ancien cluster IZAR?
Depuis plusieurs années, l’EPFL s’engage activement dans une démarche écoresponsable, notamment dans la gestion de ses infrastructures informatiques de pointe.
Depuis le 1er novembre, le cluster IZAR est dédié exclusivement à des activités académiques, telles que la formation des étudiants à l'utilisation des technologies de simulation numérique appliquées à la recherche ou les projets de fin de semestre des étudiants de Master. Cette réaffectation enrichit notre offre pédagogique tout en prolongeant la durée de vie utile des supercalculateurs, alignant ainsi l'utilisation des ressources informatiques avec nos engagements en matière de durabilité.
De plus, les clusters destinés à un usage académique, moins sollicités que ceux dédiés à la recherche intensive, bénéficient d’un système d’optimisation énergétique. Ce dernier éteint automatiquement les composants sous-utilisés, réduisant leur consommation énergétique et leur impact environnemental.
1 Le FLOPS est une unité de mesure utilisée pour quantifier la puissance de calcul d'un ordinateur ou d'un processeur. Elle mesure le nombre de calculs à virgule flottante pouvant être effectués en une seconde. 1 TFLOPS équivaut à 1 000 000 000 000 d'opérations en virgule flottante par seconde.