Mit Hilfe von KI die beste medizinische Behandlung wählen
Charlotte Bunne, Leiterin der EPFL-Gruppe für künstliche Intelligenz in der Molekularmedizin, entwickelt KI-Algorithmen, um die unglaublich komplexen und hochdimensionalen Daten besser zu verstehen, die Hunderte von Gewebeschichten und Proteinmarkern in einer einzelnen Zelle darstellen. Das EPFL-Magazin Dimensions sprach mit Charlotte Brunne über ihre Arbeit an der Spitze der KI in Medizin und Biologie.
Können Sie den Schwerpunkt Ihrer Forschung beschreiben?
Wir entwickeln Diagnoseinstrumente für Kliniken, die auf KI-Technologien beruhen. Dazu gehört die Vorhersage der besten Behandlung, die ein Patient erhalten sollte, der Versuch, den Krankheitszustand eines Patienten zu verstehen und wichtige Biomarker oder potenzielle Arzneimittelziele zu entschlüsseln, die wir weiter erforschen sollten. Wichtig ist, dass das molekulare Profil und damit letztlich der damit verbundene Krankheitsphänotyp jedes Patienten einzigartig ist. Die Abstimmung von Therapien auf das molekulare Profil einer Person erfordert sowohl Messungen, die die zellulären und molekularen Faktoren erfassen, die das Ansprechen auf die Behandlung beeinflussen, als auch leistungsstarke KI-Technologien, die aus den entsprechend großen und hochdimensionalen biomedizinischen Datensätzen, die aus verschiedenen Experimenten stammen, robuste Vorhersagen treffen.
Und während wir diese unglaublichen Errungenschaften der KI im Bereich des Sehens und der Sprache sehen, sind biologische Daten ganz anders: Messungen sind indirekt, verdeckt, multimodal und stellen nur Momentaufnahmen eines inhärent dynamischen Systems dar, das die zugrunde liegenden biologischen Prozesse steuert. Wir können nicht einfach KI-Technologien, die für die Sprache entwickelt wurden, auf den Bereich der Biologie übertragen, sondern müssen Architekturen und Lernalgorithmen auf die Feinheiten biologischer Daten und Systeme zuschneiden.
Die großen neuronalen Netzmodelle, die wir entwickeln, sind zwar in Bezug auf ihre Vorhersagen oft Black Boxes, aber wir müssen sie so gestalten, dass wir zumindest verstehen, welche biologischen Faktoren zu einer Vorhersage beigetragen haben. Dieses Verständnis ist für die Entdeckung von Biomarkern und Wirkstoffzielen von entscheidender Bedeutung, da es spezifische biologische Mechanismen und Wege aufzeigt, die mit einer Krankheit verbunden sind, und so neue therapeutische Möglichkeiten eröffnet.
Erzählen Sie mir etwas über Ihren Hintergrund - wie haben Sie angefangen, in diesem wirklich innovativen Bereich zu arbeiten, und wie wurde Ihr Interesse geweckt?
Ich habe früh angefangen! Mit 14 Jahren nahm ich an einem Schülerstipendienprogramm des Deutschen Krebsforschungszentrums teil und war fasziniert von der synthetischen Biologie, einem Gebiet, das Ingenieurwesen, Informatik und Biotechnologie miteinander verbindet. Seitdem bin ich überzeugt, dass wir nur mit wirklich interdisziplinären Ansätzen unsere Ziele erreichen können. Im Rahmen meiner Professur bin ich nun mit der School of Life Sciences und der School of Computer Sciences der EPFL verbunden.
Als Gymnasiast haben wir einfache Bakterienzellen so verändert, dass sie eine neue Funktion erhielten: So konnten wir sie als kleine Maschinen in einem Produkt verwenden. Jetzt interessiere ich mich dafür, wie wir menschliche Zellen so verändern können, dass sie diagnostische Eigenschaften haben, wie wir ihr Verhalten auf Therapien vorhersagen können oder wie wir sie von einem kranken in einen gesunden Zustand umprogrammieren können. Auch wenn sich die Ziele, die Instrumente und vor allem der Grad der Komplexität von der Arbeit, die ich mit 14 Jahren gemacht habe, nicht unterscheiden könnten, ist der Kern doch derselbe geblieben.
Es liegt auf der Hand, dass dieser Forschungsbereich eine wichtige Triebkraft auf dem Weg zur personalisierten Medizin ist. Wie schnell entwickelt es sich weiter, und hat es in den letzten Jahren mit den Fortschritten der KI wirklich an Bedeutung gewonnen?
Als junger Forscher bin ich Teil einer Revolution, die schon seit einiger Zeit im Gange ist. Das Feld hat sich in letzter Zeit unglaublich schnell gewandelt, weil wir jetzt biologische Hochdurchsatzdaten in einer noch nie dagewesenen Auflösung erzeugen können. Die Organisation riesiger Sammlungen biomedizinischer Datensätze ist die Grundlage für das Training großer neuronaler Netze. Der Erfolg des jüngsten Nobelpreises für Chemie, der zum Teil an Wissenschaftler verliehen wurde, die das Tool AlphaFold zur Vorhersage von Proteinstrukturen entwickelt haben, ist zum Beispiel zu einem großen Teil der Protein Data Bank zu verdanken, einer großen Sammlung von Proteinstrukturen, die für jedermann frei zugänglich ist.
Unsere Forschung findet eine Ebene höher statt, wo wir versuchen, die biologische Funktion und das Verhalten von Zellen und Geweben zu simulieren. Wir stützen unsere KI-Modelle auf Daten, die Hunderte von Merkmalen in einzelnen Zellen messen und Einblicke in die subzelluläre Lage, das Vorhandensein und die Häufigkeit einzelner Proteine und Moleküle innerhalb einer Zelle geben. Wir sammeln diese sehr umfangreichen Daten zunehmend in Datenbanken, so dass der Fortschritt auf eine Kombination aus der Verfügbarkeit von mehr Proben und dem Erhalt sehr umfangreicher und hochaufgelöster Daten über menschliche Zellen zurückzuführen ist.
Häufig arbeiten wir jedoch immer noch mit einer geringen Datenmenge und verfügen nicht über umfassende Datensätze, die z. B. dynamische zelluläre Prozesse im Laufe der Zeit und über physikalische Größenordnungen hinweg erfassen: Insbesondere gibt es kaum gepaarte Daten, die molekulare Veränderungen mit dem Verhalten auf Gewebeebene verknüpfen.
Sie erwähnten die Datenerfassung und die Datenbanken, die eine wesentliche Grundlage für Ihre jetzige Arbeit darstellen. Natürlich gibt es Fragen zum Datenschutz und dazu, wie Patientendaten zum Trainieren von Algorithmen für maschinelles Lernen verwendet werden können. Wie funktioniert das und wie ist die Schweiz im globalen Kontext einzuordnen?
Natürlich erfordern Patientendaten höchste Sensibilität. Solche Daten werden in sicheren Computerumgebungen aufbewahrt, und die Datenschutzbestimmungen stellen strenge Anforderungen an die Handhabung und Verarbeitung solcher Daten. Einzigartig in der Schweiz ist die Koordination der Anstrengungen zur Entwicklung interoperabler Dateninfrastrukturen, die den landesweiten Zugang und Austausch von Gesundheitsdaten ermöglichen. Dies bildet die Grundlage für die Entwicklung von KI-Algorithmen, die wachsende Datenbanken mit vielfältigen und repräsentativen Patientendaten nutzen. Unsere Arbeit profitiert von diesen enormen Anstrengungen und Ökosystemen, die in den letzten Jahren in der Schweiz entstanden sind.
Ein weiterer Eckpfeiler unserer Forschung ist der enge Austausch mit Klinikern und Biologen. Für uns bedeutet dies, dass wir unsere KI-Lösungen in enger Zusammenarbeit entwickeln und sie so anpassen können, dass sich die von uns entwickelten Diagnosetools nahtlos in die klinischen Routinen und Prozesse integrieren. Gleichzeitig ermöglicht uns diese enge Zusammenarbeit mit Klinikern und Biologen, die künftige Datengenerierung in Bereichen zu beeinflussen und zu steuern, in denen zu wenig Daten erhoben werden, oder Messungen von Datenmodalitäten zu priorisieren, die tiefere Einblicke in die molekulare Beschaffenheit von Zellen und Geweben bieten. Wir gehen davon aus, dass eine solche KI-gesteuerte Datenerfassung die Fähigkeiten der von uns entwickelten KI-Modelle erheblich verbessern wird.
Sie sind auch an einer globalen Gemeinschaft beteiligt, die KI-gestützte virtuelle Zellen entwickeln will. Was sind das für Zellen und wie werden sie die aktuelle Forschung voranbringen?
Es gibt unzählige Möglichkeiten, die Biologie auf vielen verschiedenen physikalischen Ebenen zu messen, von molekularen Interaktionen bis hin zur Architektur von Geweben. Die Frage, die wir beantworten wollen, lautet: Wie können wir all diese Messungen integrieren, um ein vollständiges Bild und ein umfassendes Verständnis von Zellverhalten und -funktion zu erhalten? Können wir insbesondere vorhersagen, wie sich der molekulare Zustand einer Zelle durch eine äußere Störung wie ein Medikament, einen Umwelteinfluss, eine Krankheit oder eine Behandlung verändern wird? Im Wesentlichen wollen wir verstehen, warum eine Zelle einen bestimmten Zustand annimmt und nicht einen anderen.
Dank der Fortschritte bei den Messtechniken und der immer leistungsfähigeren KI-Architekturen verfügen wir nun über die Instrumente, um solche Herausforderungen zu bewältigen. Einige dieser KI-Modelle basieren auf Messdaten einzelner Zellen, während andere sich auf die Entschlüsselung der DNA-Sprache oder die Vorhersage der Proteinfaltung konzentrieren. Die Vision ist die Schaffung eines multimodalen, multiskaligen Grundmodells - einer KI-gestützten Virtuellen Zelle -, das all diese Bemühungen und Messungen integriert und das Verhalten von Molekülen, Zellen und Geweben über eine Reihe von Zuständen und Bedingungen hinweg darstellt und simuliert. Eine KI-gestützte virtuelle Zelle dient als erlernter, universeller Simulator, der in der Lage ist, zelluläre Systeme unter verschiedenen Szenarien zu modellieren, darunter Differenzierung, Krankheitszustände, stochastische Fluktuationen und Umwelteinflüsse.
Es handelt sich hierbei um ein umfangreiches, gemeinschaftliches Projekt, an dem eine globale Forschungsgemeinschaft beteiligt ist. Viele Gruppen arbeiten an verschiedenen Komponenten dieses Puzzles, und unsere Herausforderung und Chance besteht darin, diese Beiträge in eine kohärente Vision zu integrieren, die die Grenzen dessen, was in der biomedizinischen Forschung möglich ist, erweitern wird.
Wenn Sie eine Kristallkugel hätten, wo würden Sie die KI in der Biomedizin in einem Jahrzehnt sehen? Was werden Sie in zehn Jahren tun?
Es gibt einige einfachere Aufgaben in der Biologie, die wir gelöst haben könnten und für die wir genaue Vorhersagen machen können. Erfolgsgeschichten wie AlphaFold zeigen, dass wir bestimmte isolierte Probleme lösen können, und ich erwarte weitere Durchbrüche dieser Art im nächsten Jahrzehnt. Die Komplexität biologischer Systeme - mit unzähligen molekularen Wechselwirkungen, die sich auf Zeitskalen von Pikosekunden bis hin zu Prozessen, die über Jahre hinweg ablaufen, zu einer Gesamtdynamik auf Systemebene organisieren - vollständig zu erfassen, ist jedoch eine monumentale Aufgabe. Ich glaube, dass wir noch viele, viele Jahre lang unzählige Probleme lösen und Fragen beantworten werden müssen.