«Nous ne nous contentons pas d'acheter un nouvel ordinateur»
ETH News : L'année dernière, la première phase d'installation du nouveau supercalculateur «Alps», le successeur du «Piz Daint», a débuté. Comment les travaux se sont-ils déroulés jusqu'à présent pendant la crise du coronanavirus ?
Thomas Schulthess : Nous avons dû modifier notre approche, mais nous avons plus ou moins pu respecter le calendrier, même s'il y a eu quelques petits retards. Lors du premier semi-confinement, il n'a pas été possible d'amener les quatre premières armoires du nouvel ordinateur des Etats-Unis en Suisse comme prévu. Mais la société de fabrication HPE a tout de même réussi à construire le matériel, de sorte que nous avons eu accès à nos machines aux États-Unis en juin et juillet et avons pu travailler dessus. La réception des armoires informatiques à Lugano en automne s'est donc déroulée sans problème majeur.
L'extension d'«Alps» durera jusqu'au printemps 2023. Pourquoi cela prend-il autant de temps ?
Parce que le produit que nous voulons n'est pas encore complètement développé. L'élément central du nouvel ordinateur est la pile logicielle Cray Shasta, que nous avons participé à développer avec d'autres centres de données. Cette pile logicielle est désormais opérationnelle, mais il faudra encore deux ans pour que l'infrastructure informatique souhaitée soit complètement prête.
Qu'est-ce que cette nouvelle infrastructure informatique a de si spécial ?
Avec la pile logicielle Cray Shasta, nous avons opté pour une infrastructure définie par logiciel. C'est le point décisif pour moi : sans cette pile logicielle, la nouvelle machine perdrait beaucoup de sa valeur à mes yeux. «Alps» serait toujours la meilleure variante de calcul haute performance disponible sur le marché dans un avenir prévisible, mais nous avons clairement des objectifs plus élevés que nous ne pourrions pas atteindre sans l'infrastructure améliorée. Ce serait une grande déception.
Qu'est-ce que cela signifie exactement ?
Au CSCS, nous exploitons principalement une infrastructure de recherche, que nous mettons à la disposition des scientifiques en tant que User Lab, entre autres choses. C'est notre mission principale. Cependant, contrairement à d'autres infrastructures de recherche, comme le SwissFEL au PSI, nous ne faisons pratiquement pas de recherche propre sur nos instruments. Nous devons donc trouver un moyen créatif d'élargir notre propre expertise afin de pouvoir continuer à développer l'infrastructure de recherche. C'est pourquoi nous collaborons étroitement avec des chercheuses et chercheurs d'universités suisses.
Le CSCS ne se considère donc pas d'abord comme un prestataire de services ?
Si, mais pas dans le sens d'une entreprise informatique qui se contente d'exploiter des ordinateurs pour pouvoir offrir du temps de calcul. Pour nous, l'ordinateur est un moyen et la finalité est l'infrastructure de recherche, que nous construisons et développons avec les scientifiques grâce au financement du Conseil des EPF ; les coûts d'exploitation sont couverts par les contributions de l'ETH Zurich. Nous voulons maintenant poursuivre le développement de cette infrastructure de recherche avec un programme dont le nom de code est Kathmandu.
En quoi consiste exactement ce programme Kathmandu ?
Le programme Kathmandu est une partie importante du nouvel approvisionnement mentionné ci-dessus. Nous ne nous contentons pas d'acquérir un nouvel ordinateur qui sera intégré dans le centre informatique inchangé - nous réaménageons le centre informatique en plusieurs phases d'expansion. Aujourd'hui, nous utilisons différents systèmes informatiques pour différents besoins au CSCS, mais à l'avenir, il n'y aura plus qu'une seule infrastructure. Pour MétéoSuisse, par exemple, nous avons exploité jusqu'à présent un ordinateur dédié. À l'avenir, MétéoSuisse calculera sur une ou plusieurs partitions de cette nouvelle infrastructure.
Quel est l'avantage de cette solution ?
Au CSCS, nous avons toujours offert divers services aux chercheuses et chercheurs, mais l'architecture du système n'était pas orientée services. Par conséquent, nous avons toujours dû consacrer beaucoup de ressources humaines pour définir ces services en fonction des exigences des utilisatrices et utilisateurs et de l'architecture des machines. Ce processus est désormais plus facile car nous disposons d'une infrastructure définie par logiciel.
Que signifie une infrastructure définie par logiciel ?
Si nous faisons tout bien avec HPE, notre matériel sera très flexible. Cela signifie qu'à l'avenir, nous définirons les services que nous offrons par le biais du logiciel et non plus du matériel. Pour ce faire, nous combinons ce que l'on appelle des microservices. Nous définissons ainsi les partitions pour les différentes utilisatrices et les différents utilisateurs, que nous mettons ensuite à leur disposition via des interfaces standardisées. Il peut s'agir de clusters virtuels ad hoc pour des utilisatrices et utilisateurs individuels, mais aussi de clusters prédéfinis que des infrastructures de recherche telles que le PSI mettent en place avec nous et exploitent ensuite elles-mêmes. Nous pouvons également créer des plateformes de données avec les microservices. Nous prévoyons par exemple de développer avec différents partenaires une plateforme dite de domaine pour les simulations météorologiques et climatiques.
Vous mentionnez explicitement le domaine de la météo et du climat. «Alps» sera-t-il également utile pour d'autres domaines scientifiques ?
Oui, avec «Alps», nous développons un «supercalculateur à usage général». Nos objectifs ne s'arrêtent pas du tout aux simulations climatiques. Cependant, celles-ci constituent un très bon moyen d'arriver à nos fins, car le problème est très clairement formulé dans les simulations climatiques. En outre, elles représentent toutes les exigences d'une infrastructure moderne de supercalculateurs et de données. Nous répondons à ces exigences très spécifiques avec une infrastructure que nous pouvons ensuite également proposer à d'autres domaines de recherche.
Qu'est-ce que cela change pour le User Lab ?
Les utilisatrices et utilisateurs de «Piz Daint» pourront utiliser le nouveau système sans aucune adaptation. Cela devrait même être plus facile pour eux. Nous allons également poursuivre le développement de la plateforme HPC pour le User Lab en tant que zone virtuelle au sein du système informatique. Les ressources seront ainsi plus puissantes et couvriront de plus grandes parties du flux de travail. Les scientifiques pourront non seulement effectuer des simulations, mais aussi prétraiter ou post-traiter leurs données. L'ensemble du flux de travail sera ainsi plus efficace pour eux.
Il n'y a donc pas grand-chose qui change pour les utilisatrices et utilisateurs. Quel impact aura le remplacement pour le personnel du CSCS ?
La nouvelle stratégie nécessitera de repenser fondamentalement certains domaines. Les ingénieurs qui assurent le support système et utilisateur devront s'adapter, par exemple, parce que les anciens ordinateurs que nous exploitions en plus du «Piz Daint» seront à l'avenir des clusters virtuels. Certains membres du personnel développeront et maintiendront des microservices, tandis que d'autres combineront ces microservices en clusters virtuels ou en applications qui seront ensuite mis à la disposition des chercheurs en tant que services.
De grands efforts sont actuellement déployés en Europe pour faire progresser le calcul à haute performance. Cela inclut notamment l'initiative Pre-Exascale de l'UE. Comment le CSCS participe-t-il à ces efforts ?
Le CSCS est membre du consortium LUMI, qui fait partie de l'initiative Pre-Exascale. L'acronyme signifie Large Unified Modern Infrastructure. Il s'agit d'un nouveau supercalculateur pré-exascale qui sera situé en Finlande. Le consortium LUMI compte dix États membres, dont les pays scandinaves, où les conditions de production d'électricité bon marché et sans CO2 et de refroidissement des ordinateurs sont optimales.
Pourquoi cet aspect est-il si important ?
On peut l'expliquer en prenant l'exemple de la recherche climatique. Notre objectif est de développer des modèles climatiques permettant de cartographier les nuages convectifs tels que les nuages d'orage. «Alps», le successeur de «Piz Daint», aura une charge connectée de 5 à 10 mégawatts. Cependant, une infrastructure informatique qui doit fournir de manière productive la résolution susmentionnée pour la climatologie doit avoir une puissance 50 fois supérieure. Comme nous ne pouvons plus obtenir de gains de performance par la loi de Moore, il nous faut une machine 50 fois plus grande que «Alps», ce qui augmentera d'autant la consommation d'énergie. Il est donc logique de construire une telle infrastructure informatique là où l'énergie nécessaire peut être produite à bon marché et de manière écologique. Nous n'avons pas de tels emplacements en Europe centrale, mais nous en avons en Europe du Nord.
Quel est le calendrier de la LUMI ?
L'ordinateur LUMI est également construit par HPE et devrait atteindre la classe de performance pré-exascale à l'automne 2021 avant d'être mis en service au printemps 2022. Notre système «Alps» sera installé un an et demi plus tard, à la fin de 2022, et remplacera complètement «Piz Daint» en avril 2023. Mais nos nouveaux services seront déjà disponibles ce printemps et seront étendus plus tard dans l'année lors des premières phases d'expansion ; et nous essaierons d'intégrer également la LUMI. Nous disposerons alors d'une infrastructure globale très solide, fonctionnant sur deux sous-infrastructures, «Alps» et LUMI. Nous avancerons plus rapidement dans cette direction que d'autres en Europe.
Cela signifie-t-il que les ressources informatiques suisses seront délocalisées à l'étranger à l'avenir ?
Non, mais nous devons être réalistes : nous n'exploiterons jamais en Suisse des ordinateurs de 100 MW ou plus. Nous devons concentrer les ressources informatiques locales sur des projets pilotes innovants et les intégrer dans un réseau plus large pour la production. Notre intention est de développer des plateformes logicielles qui fonctionnent sur les deux infrastructures, de sorte que les utilisatrices et utilisateurs ne remarquent pratiquement pas si leur application fonctionne en Finlande ou à Lugano.
Le Centre national suisse de calcul scientifique
Le Centre national suisse de calcul scientifique (CSCS) développe et fournit l'infrastructure et le savoir-faire dans le domaine du calcul haute performance (HPC) afin de résoudre des problèmes scientifiques et sociétaux importants. Il met en œuvre la stratégie nationale pour le calcul haute performance et les réseaux (HPCN), adoptée par le Parlement suisse en 2009. Depuis 2011, le CSCS dispose d'un User Lab dédié au calcul intensif et fait partie de la feuille de route de l'infrastructure de recherche suisse. Depuis 2020, il est également membre du consortium européen LUMI, qui construit un supercalculateur européen de la classe de performance pre-exascale.