Neuer Supercomputer ermöglicht innovative und nachhaltige Forschung
In den Forschungslaboratorien der EPFL fallen täglich riesige Datenmengen an. Wer beispielsweise die Dienste des Scientific IT & Application Support Department (SCITAS) der EPFL in Anspruch nimmt, generiert alle drei Monate 314 Terabyte an Daten – und diese Daten müssen fünf bis zehn Jahre lang aufbewahrt werden.
Um all diese Daten effizient verarbeiten zu können, braucht es natürlich leistungsfähige Computer. Doch mit der zunehmenden Rechenleistung moderner Supercomputer steigt auch deren CO2-Bilanz. Deshalb hat die Entwicklung ebenso leistungsfähiger wie energieeffizienter IT-Geräte und -Infrastrukturen oberste Priorität.
EPFL erhält einen Supercomputer von Weltrang
Die EPFL hat mit Kuma, einem neuen Supercomputer, der von SCITAS implementiert und betrieben wird, einen wichtigen Schritt zur Erreichung dieses Ziels gemacht. Er ermöglicht unseren Forschenden den Zugang zu Hochleistungsrechenkapazitäten durch ein benutzerfreundliches System mit einer intuitiven Schnittstelle und einem umweltfreundlichen Design. Die Server von Kuma sind im Rechenzentrum installiert, das mit dem neuen Heizwerk der EPFL verbunden ist, das Wasser aus dem Genfersee bezieht, um die IT-Geräte zu kühlen und den Rest des Campus mit Wärme zu versorgen.
«Dank Kuma wird die EPFL in der Lage sein, in den Bereichen künstliche Intelligenz und nachhaltiges Computing immer wieder neue Wege zu beschreiten und weltweit den Takt vorzugeben», sagt Gilles Fourestey, Betriebsleiter des SCITAS, und fügt hinzu: «Die leistungsstarken Prozessoren des Supercomputers werden die Innovation in Anwendungen beschleunigen, die bereits stark auf Rechenkapazitäten angewiesen sind, wie z.B. im Gesundheitswesen, in der Klimaforschung, in den Materialwissenschaften und in anderen kritischen Bereichen», so Michele Ceriotti, Direktor des wissenschaftlichen Lenkungsausschusses der Plattform.
Kuma wurde im Rahmen einer gemeinsamen Initiative von Lenovo und dem EcoCloud-Zentrum der EPFL entwickelt. Lenovo lieferte die Datenverarbeitungs- und Speichersysteme und wird während der gesamten Lebensdauer des Supercomputers technische Unterstützung leisten. In der Zwischenzeit hat EcoCloud ein System zur präzisen Messung der Verarbeitungsgeschwindigkeit und zur Bewertung der Energieeffizienz entwickelt.
«Für EcoCloud war diese Zusammenarbeit mit SCITAS der Schlüssel zur Anwendung der EPFL-Forschung im Bereich des nachhaltigen Computings auf die Entwicklung von Spitzen-Supercomputern, die im neuen EPFL-Rechenzentrum eingesetzt werden können», sagt David Atienza, ehemaliger wissenschaftlicher Direktor des EcoCloud-Zentrums und stellvertretender Vizepräsident für Zentren und Plattformen an der EPFL. «Dies ist ein grossartiges Beispiel für die Zusammenarbeit zwischen dem Vizepräsidium für Zentren und Plattformen (AVP-CP) und dem Vizepräsidium für Betrieb (VPO) bei der Entwicklung nachhaltiger Recheninfrastrukturen. Darüber hinaus gibt das grossartige Ergebnis des Green500-Rankings uns allen eine klare zusätzliche Motivation, diese Zusammenarbeit in Zukunft weiter voranzutreiben.»
Wo Hochleistungscomputer auf Energieeffizienz treffen
Kuma schneidet im internationalen Vergleich gut ab. In der Green500-Rangliste der energieeffizientesten Supercomputer der Welt liegt er auf Platz 23 – und auf Platz 10, wenn man nur Supercomputer berücksichtigt, die an Universitäten installiert sind. Es ist das erste Jahr, in dem die EPFL in den Green500 vertreten ist. Auch in der Top500-Rangliste der weltweit leistungsstärksten Supercomputer belegt Kuma Platz 103, womit die EPFL nach einer achtjährigen Pause wieder in diese Liste aufgenommen wurde. Diese aussergewöhnliche Leistung macht Kuma zu einer der leistungsstärksten Forschungscomputerplattformen in Bezug auf Leistung und Kohlenstoffemissionen.
Kuma wird von 334 NVIDIA-Grafikkarten der nächsten Generation angetrieben, die in 84 Servern untergebracht sind, die über ein Ultra-High-Speed-Netzwerk (400 GB/s) verbunden sind. Das Festplattenpartitionierungssystem H100 des Supercomputers hat einen Energiebedarf von nur 18 Watt pro TFLOPS1. Zum Vergleich: Der Vorgänger von Kuma, IZAR (in Betrieb zwischen 2020 und 2024), hatte einen Energiebedarf von 81 Watt pro TFLOPS.
Kuma war weniger als 90 Tage nach seiner Auslieferung betriebsbereit – eine beachtliche Leistung im IT-Bereich. Antonio J. Russo, Leiter der HPC-Systeme bei SCITAS, sagt: «Das spiegelt nicht nur die nahtlose Zusammenarbeit zwischen der EPFL und Lenovo wider, sondern auch unsere effizienten DevOps-Prozesse bei SCITAS, die es uns ermöglichten, eine breite Palette von Forschungssoftware schnell zu implementieren. Es unterstreicht auch die effektive Art und Weise, in der die Forschungszentren und IT-Abteilungen der EPFL – einschliesslich SCITAS und EcoCloud – zusammenarbeiten konnten.»
Das Schweizer Ökosystem für Hochleistungscomputer wird gestärkt
Die Anschaffung des Kuma-Systems durch die EPFL fügt sich in den laufenden Plan des Bundes ein, der darauf abzielt, die Schweiz an der Spitze der Rechnerkapazitäten für die wissenschaftliche Forschung zu halten. Diese Initiative spiegelt das anhaltende Engagement der Schweiz wider, ihren Wissenschaftlern den Zugang zu den leistungsfähigsten Computersystemen zu garantieren und so die Position des Landes als weltweit führendes Forschungsland zu unterstützen.
Kuma erweitert das Ökosystem des Hochleistungsrechnens in der Schweiz und stellt den Forschenden der EPFL eine neue, leistungsstarke Rechenressource zur Verfügung. Kuma kann als Ergänzung zum Alps-Supercomputer gesehen werden, der vor kurzem am Swiss National Supercomputing Centre (CSCS) in Lugano eingeweiht wurde. Alps, eine nationale Forschungsressource, basiert ebenfalls auf der neuesten Generation von NVIDIA-Grafikkarten und erfüllt damit die höchsten Anforderungen an Rechen- und Datenverarbeitungsleistung und trägt zur nationalen KI-Strategie der Schweiz bei. Aus einer ganzheitlichen Perspektive betrachtet, stärken Kuma und Alps die nationale Forschungsinfrastruktur der Schweiz und bieten Schweizer Wissenschaftlerinnen und Wissenschaftlern einzigartige Werkzeuge, um grosse wissenschaftliche Herausforderungen zu bewältigen.
Was ist mit IZAR passiert?
Am 1. November wurde das IZAR migriert, so dass es nun ausschliesslich für Bildungsaktivitäten zur Verfügung steht, z. B. für die Schulung von Studenten im Umgang mit Computersimulationssoftware für Forschungsanwendungen oder die Unterstützung von Masterstudenten bei der Durchführung ihrer Semesterprojekte. Durch diese Umstellung wird nicht nur die Ausbildung unserer Studierenden verbessert, sondern auch die Lebensdauer der Supercomputer verlängert und sichergestellt, dass unsere IT-Systeme in einer Weise genutzt werden, die mit unserem Engagement für Nachhaltigkeit im Einklang steht.
Die Supercomputer, die an der EPFL für Ausbildungszwecke eingesetzt werden, werden weniger intensiv genutzt als die Hochleistungsrechner für die Forschung. Sie sind daher mit einer Energieeffizienzfunktion ausgestattet, die nicht genutzte Komponenten automatisch ausschaltet und so den Energieverbrauch und die CO2-Bilanz der Hardware insgesamt reduziert.
1FLOPS = Gleitkommaoperationen pro Sekunde, die Maßeinheit zur Bewertung der Prozessorgeschwindigkeit. 1 TFLOPS entspricht 1x1012 FLOPS.