GenAI läutet eine neue Ära der Arzneimittelforschung ein
Alle Lebewesen sind aus Proteinen aufgebaut. Sie spielen eine Schlüsselrolle für die Zellstruktur, die Ernährung und die Gesundheit sowie für die Wechselwirkungen zwischen Medikamenten und Körper.
Jüngste Fortschritte im Proteindesign könnten eine neue Ära der Arzneimittelforschung einläuten. An der Spitze dieser Revolution steht die generative künstliche Intelligenz (GenAI), die in der Lage ist, völlig neue Arten von Proteinen zu entwerfen. Auch neue bildgebende Verfahren wie die Röntgenkristallografie und die kryogene Elektronenmikroskopie spielen eine wichtige Rolle, da sie es den Wissenschaftlerinnen und Wissenschaftlern ermöglichen, die Zusammensetzung von Proteinen in der realen Welt mit bisher unerreichter Präzision zu beobachten. Die Kombination dieser neuen Technologien könnte den Weg zu neuartigen Verfahren ebnen, die es den Forschenden u. a. ermöglichen, innovative biologische Medikamente, so genannte Biologics, zu entwickeln.
Biomoleküle aus der Nähe betrachtet
Unser heutiges Wissen über die Wechselwirkungen zwischen Proteinen und Zellen beruht auf empirischen Daten, die wir in jahrelanger biomedizinischer Forschung gesammelt haben. Um nur ein Beispiel zu nennen: Wir wissen genau, welche Rolle Insulin im Glukosestoffwechsel spielt. Aber zahllose andere Wechselwirkungen zwischen Proteinen und Zellen sind nach wie vor ein Rätsel – ebenso wie die Gründe und Mechanismen für krankheitsverursachende Proteinfehlfunktionen.
Das Aufkommen neuer Methoden und Technologien erweitert den wissenschaftlichen Kenntnisstand in exponentiellem Tempo. Mit Hilfe der kryogenen Elektronenmikroskopie – einer Methode, die am EPFL-UNIL Dubochet Center for Imaging praktiziert und entwickelt wurde – konnten die Forschenden in vitro beobachten, wie das Spike-Protein der SARS-CoV-2 Omicron-Variante mit den Rezeptoren auf der Oberfläche menschlicher Zellen interagiert, was Einblicke in die schnelle Ausbreitung des Virus im Körper und seine Immunität gegen Impfstoffe, die für frühere Varianten entwickelt wurden, ermöglicht.
Spike
© Emphase / EPFL
Das Spike-Protein, das als Speerspitze des SARS-CoV-2-Virus für das Eindringen in menschliche Zellen bekannt ist, erlangte während der Pandemie Berühmtheit. Das Spike-Protein bindet sich an die ACE2-Proteine auf bestimmten Zellmembranen (auch in den Atemwegen) und öffnet so die Tür für das Virus, um einzudringen. Es besteht aus drei identischen Ketten, die aus der Virushülle herausragen. Das Spike-Protein ist ein Glykoprotein – das heisst, es ist mit Zuckern überzogen, die zufällig menschlichen Ursprungs sind. Wenn die Zuckerhülle dick genug ist, wirkt sie wie ein «unsichtbarer Umhang» und macht das Virus für unser Immunsystem unauffindbar.
Das Spike-Protein ist ein Hauptziel für unser Immunsystem bei der Bekämpfung einer Infektion – und Impfstoffe sind ein starker Verbündeter in diesem Kampf. Bei der Entwicklung von SARS-CoV-2-Impfstoffen setzten die Wissenschaftler eine Reihe von Methoden ein. Eine davon bestand in der Synthese und anschliessenden Reinigung des Spike-Proteins des Virus, das dann auf Nanopartikeln aufgebracht und durch subkutane Injektionen verabreicht wurde. Der Impfstoff veranlasst das Immunsystem des Empfängers zur Bildung von Antikörpern, da das Spike-Protein als Fremdkörper erkannt wird. Bei mRNA-Impfstoffen wird nicht ein Abbild des Spike-Proteins verabreicht, sondern der «Bauplan» des Proteins in Form von mRNA. Dadurch können die eigenen Zellen des Empfängers das Spike-Protein synthetisieren, gegen das das Immunsystem spezifische Antikörper entwickelt.
Anwendung von Deep Learning auf das Leben
Ähnlich rasche Fortschritte werden in einem anderen Bereich erzielt: der Anwendung des maschinellen Lernens in den Biowissenschaften. Die Gewinner des Nobelpreises für Chemie 2024 sind David Baker, ein amerikanischer Pionier der Computerbiologie, sowie Demis Hassabis – ein EPFL-Doktor Honoris Causa-Preisträger – und John M. Jumper, die gemeinsam AlphaFold entwickelt haben, ein mehrfach ausgezeichnetes KI-Benchmark-Modell zur Vorhersage der Struktur von Molekülen.
Neue Biomoleküle entwerfen
Die EPFL ist auch im Bereich des Proteindesigns sehr aktiv. Seit mehr als fünf Jahren setzt das von Bruno Correia geleitete Laboratory of Protein Design & Immunoengineering der Hochschule maschinelles Lernen ein, um das interaktive Potenzial zwischen Proteinen und ihren Rezeptoren vorherzusagen: «Der Einsatz von Deep Learning im biologischen Engineering eröffnet spannende neue Möglichkeiten», sagt Correia.
Diese bahnbrechende Arbeit trägt nicht nur zu einem besseren Verständnis der Funktionsweise lebender Organismen bei, sondern markiert auch den Ausgangspunkt für eine sich anbahnende Revolution in der Arzneimittelforschung. Denn wenn GenAI-Programme wie ChatGPT auf Protein- und Molekülinteraktionsdaten trainiert werden, die von Forschenden und Modellen wie AlphaFold generiert wurden, können die Programme völlig neue Arten von Molekülen in unzähligen Formen entwerfen und modellieren und ihre Interaktionen mit Zellen simulieren. Und die Programme können Milliarden solcher Berechnungen pro Sekunde durchführen, bis sie Moleküle finden, die theoretisch für die Entwicklung von Medikamenten relevant sind. «Dieser neue Ansatz wird nichts weniger als ein Paradigmenwechsel für den gesamten Bereich der Biotechnologie sein», fügt Correia hinzu.
Von der Planung zur Realität
Es gibt jedoch verschiedene Möglichkeiten, bestehende oder bisher unbekannte Proteine auf Abruf zu produzieren. Genau das tun Florence Pojer und ihre Forschungsgruppe in der Protein Production and Structure Core Facility (PTPSP) der EPFL, wo Flaschen mit rötlichen Flüssigkeiten stundenlang in Glasschränken geschüttelt werden. «In diesen Flaschen befinden sich zum Beispiel menschliche embryonale Nierenzellen (HEK-Zellen), die seit Jahrzehnten immortalisiert und kultiviert werden», erklärt Pojer, «aus ihnen stellen wir Proteine wie Antikörper her, nachdem wir die Zellen zuvor mit Plasmiden transfiziert haben, die die gewünschte Sequenz enthalten.»
Die Wissenschaftlerinnen und Wissenschaftler des PTPSP stellen auch andere Arten von Zell- und Bakterienmischungen her, je nachdem, welche Ergebnisse sie erreichen wollen. Die endgültige Lösung wird dann gereinigt, um die Zielproteine zu isolieren. «Theoretisch ist es möglich, jedes beliebige Protein aus seiner genetischen Sequenz herzustellen», fügt sie hinzu, «aber derzeit kann nur ein winziger Bruchteil der Proteine, die in silico, also am Computer, entworfen wurden, tatsächlich hergestellt werden und in der realen Welt funktionieren. Die Idee hinter den neuen biotechnologischen Ansätzen ist es, das Spektrum dessen, was wir in Zukunft herstellen können, zu erweitern.»
Ein Grossteil dieser innovativen Technologie wird an der EPFL angewandt oder entwickelt – nicht nur von Correia und seiner Forschungsgruppe, sondern auch im Labor von Sebastian Maerkl, wo sich die Forschenden nicht auf biologische Prozesse in lebenden Zellen, sondern auf In-vitro-Forschung konzentrieren und dabei die rund 30 Enzyme verwenden, die für die Proteinproduktion tatsächlich benötigt werden. Die Forschungsgruppe von Matteo Dal Peraro erforscht durch Beobachtung, Modellierung und Simulation grosse makromolekulare Systeme und ihre Handlungsfähigkeit, die durch ihre Struktur und Zusammensetzung bestimmt wird.
Ein grosses Konsortium im Entstehen
Derzeit laufen verschiedene ergänzende Forschungsprojekte an Schulen und Universitäten in der ganzen Schweiz. An der EPFL bauen Correia und Beat Fierz ein Konsortium auf, das eine neue Ära der Arzneimittelforschung einläuten soll – eine Ära, die durch maschinelles Lernen angetrieben wird. Die Bündelung unter einem Dach würde nicht nur die Position der Schweiz als Kompetenzzentrum in diesem Bereich festigen, sondern auch die rasche Entwicklung wirksamer neuer Proteine für klinische Anwendungen fördern. Die Idee ist, die Entwicklung von KI-gestützter Moleküldesigntechnologie zu fördern, neue Arten von Arzneimittel-Zell-Interaktionen zu erforschen, neue Datenbanken zu erstellen, um die Leistung von Design-Software weiter zu verbessern, und Nachwuchswissenschaftler darauf vorzubereiten, neue Forschungs- und Technologietransfermöglichkeiten zu nutzen. Es ist ein ehrgeiziges Vorhaben, das die Wissenschaftler sicher über Generationen hinweg in seinen Bann ziehen wird.
AlphaFold, das zu Google DeepMind gehört, ist ein KI-Modell, das anhand der Aminosäuresequenz eines Proteins vorhersagt, wie es gefaltet ist – ein struktureller Faktor, der sowohl seine Funktion als auch seine Fähigkeit zur Interaktion mit seiner Umgebung bestimmt. AlphaFold 3, die neueste Version, die im Mai 2024 veröffentlicht wurde, kann sogar die Struktur und die Interaktionen von DNA- und RNA-Strängen modellieren, was es Forschern ermöglicht, die genauen zellulären Mechanismen zu identifizieren, die bei der Entwicklung neuer Medikamente eine wichtige Rolle spielen. Es wurde als Open-Source-Modell veröffentlicht, so dass Wissenschaftler auf der ganzen Welt es für die Entwicklung neuer therapeutischer Wirkstoffe nutzen können.