«Wenn die Bildgebung Fortschritte macht, kommt auch die Wissenschaft voran»

Sabine Süsstrunk, Expertin für wissenschaftliche Fotografie, hat die erstaunlichen Fortschritte der Bildgebungstechnologie in den letzten 40 Jahren aus erster Hand miterlebt. Und nun wird ihr Fachgebiet durch künstliche Intelligenz (KI) auf den Kopf gestellt.

Anne-Muriel Brouet, Cécilia Carron 19.08.2024

Prof. Süsstrunk ist Informatikerin und leitet seit 1999 das Labor für Bilder und visuelle Repräsentation der EPFL. Sie ist ausserdem Mitglied des Lenkungsausschusses des Center for Imaging der EPFL und Präsidentin des Schweizerischen Wissenschaftsrats.

Sabine Süsstrunk - 2024 EPFL / Jamani Caillet - CC-BY-SA 4.0

Gibt es irgendetwas, das man heute mit der Bildgebung nicht sehen kann?

Bei der Bildgebung ist alles eine Frage des Massstabs, vom unendlichen Kosmos bis hin zu subatomaren Teilchen. Ganz zu schweigen von alltäglichen Bildgebungsanwendungen wie Materialwissenschaft und medizinische Diagnostik. Fortschritte in der Bildgebungstechnologie können in drei Dimensionen erfolgen: räumliche, zeitliche oder radiometrische Auflösung. Je empfindlicher die Instrumente in diesen Bereichen werden, desto mehr Dinge können sie erkennen.

Ein Beispiel?

Nehmen wir die Fernerkundung: Die Geräte werden immer leistungsfähiger und sind in der Lage, immer genauere Messungen vorzunehmen, z. B. zur Bestimmung der Bodenzusammensetzung und des Feuchtigkeitsgehalts. Dies kann Wissenschaftlerinnen und Wissenschaftlern helfen, die Auswirkungen des Anbaus bestimmter Pflanzen besser zu modellieren und nachhaltigere Anbaumethoden zu entwickeln. Weitere Ziele der Bildgebung sind die Früherkennung von Krebs, die Erforschung der Wechselwirkungen innerhalb von Zellen, die Entschlüsselung des Geheimnisses des Urknalls und die Suche nach Leben auf Exoplaneten. In der Biologie erleichtern die jüngsten Fortschritte bei der zeitlichen Auflösung – Instrumente können jetzt 1000 oder mehr Bilder pro Sekunde aufnehmen – die Entschlüsselung der Bewegungen und des Verhaltens einiger Tierarten.

Inwiefern kann die KI die Bilderzeugung verändern?

In der Weltraumbeobachtung zum Beispiel lernen wir neue Dinge, sobald ein neues Teleskop installiert wird. Aber es ist die KI, die es ihnen ermöglicht hat, das erste Bild eines schwarzen Lochs zu erzeugen. Es handelt sich eigentlich um einen positiven Kreislauf: Fortschrittlichere Instrumente können bessere Bilder für das Training von KI-Programmen aufnehmen, diese Programme rekonstruieren dann die Bilder und helfen, die Instrumente zu verbessern, was wiederum zu besseren Bildern für das Training von KI-Programmen führt, und so weiter. Bildgebung und KI gehen Hand in Hand. Für die KI wird jedoch eine grosse Anzahl von Bildern benötigt, weshalb wir Instrumente brauchen, die Bilder in grossen Mengen erzeugen können.

Und was ist mit der Bildanalyse?

Gut ausgebildete KI-Programme sind bei der Analyse von Bildern bereits besser als Menschen. Brustkrebs wird von KI besser erkannt als von Radiologen. Die Datenbank mit Mammogrammen ist so gross, dass die Entwicklenden die KI-Programme ausgiebig trainieren konnten. Aber genau hier liegt auch das Problem: KI ist praktisch nicht in der Lage, seltene Krebsarten oder andere Krankheiten zu erkennen, für die sie nicht mit genügend Datenpunkten trainiert wurde. Neben einer grossen Anzahl von Bildern ist also auch eine grosse Vielfalt wichtig. Wie zuverlässig ein System ist, hängt von der Anwendung ab und davon, wie menschliche Forschende und KI trainiert wurden. Keines von beiden ist 100 % zuverlässig.

Könnten Computersimulationen eines Tages die Bildgebung ersetzen?

KI kann die Beschränkungen physikalischer Bildgebungssysteme überwinden, indem sie Bilder so rekonstruiert, dass sie besser sind als die vom System selbst aufgenommenen. Die Kombination von KI mit hochauflösenden Instrumenten kann beispielsweise die räumliche Auflösung um einen Faktor von zwei, vier oder sogar acht erhöhen. KI funktioniert, indem sie bestimmt, welche Information als nächstes kommt. Wenn ein Programm mit genügend Daten gefüttert wurde, kann es mit einer ziemlich hohen Wahrscheinlichkeit vorhersagen, dass ein bestimmter Datenpunkt nach einem Pixel in einem Bild kommt, das von einem Instrument erfasst wurde. Das bedeutet, dass KI Dinge simulieren kann, die wir mit physischen Bildern noch nicht sehen können. Der Haken ist jedoch, dass wir keinen Beweis dafür haben, dass diese Simulationen genau sind.

Kann die KI etwas völlig falsch machen?

Auf jeden Fall. KI-Programme konstruieren Modelle, die mit hoher Wahrscheinlichkeit richtig sind – aber das ist nicht dasselbe wie Daten aus der realen Welt. KI-basierte Bilder sollten nicht in Studien verwendet werden, bei denen es wichtig ist, echte physikalische Signale zu beobachten. Andernfalls könnte dies zu denselben Problemen führen, die Nutzende mit ChatGPT haben. KI funktioniert so, wie sie trainiert wurde. Wenn ein Programm nicht darauf trainiert wurde, eine bestimmte Art von Daten oder Bildern zu erkennen, wird es diese nicht erkennen. KI-Programme wählen einfach aus, was sie bereits gesehen haben. Ein weiteres Problem ist, dass sie immer eine Ausgabe erzeugen – sie werden nie einfach sagen: «Ich weiss es nicht.» Je weiter man sich also von der ursprünglichen Anwendung entfernt, desto unzuverlässiger wird ein Programm, sei es für die Bilderzeugung, Rekonstruktion oder Analyse.

«Wissenschaftlerinnen und Wissenschaftler müssen beim Einsatz von KI in der Bildgebung transparent und ethisch handeln.» Sabine Süsstrunk

Könnte KI eine Gefahr für die Qualität und Glaubwürdigkeit wissenschaftlicher Veröffentlichungen darstellen?

Die Technologie zur Bilderzeugung macht es eindeutig leichter, falsche Bilder zu produzieren. Aber Fälschungen gab es schon lange vor der KI. Es wurde lange Zeit geforscht, bevor die Fragen der offenen Wissenschaft und der Reproduzierbarkeit aufkamen. Wichtig ist die Ethik der einzelnen Forschenden.

Wie stellt man fest, ob Forschungsergebnisse zuverlässig sind?

Ich persönlich bin skeptisch, wenn die Autoren ihren Code nicht zur Verfügung stellen und nicht klar angeben, welche Art von Daten verwendet wurden. Dies sind grundlegende Kriterien für die Reproduzierbarkeit. Ich glaube auch nicht die Hälfte der Forschungsergebnisse, die von grossen Unternehmen veröffentlicht werden. Allerdings mache ich bei medizinischen Studien eine Ausnahme, da die Daten sensibel sind und nicht veröffentlicht werden können. Aber selbst wenn die Autoren ihren Code zur Verfügung stellen, ist es oft schwierig, die Ergebnisse zu reproduzieren. In der Regel fehlen am Ende ein paar Prozentpunkte.

Könnten Forschende versehentlich KI mit ihren Bildern missbrauchen?

Die Bildgebung wird für die Wissenschaft im Allgemeinen immer wichtiger, da die Methoden der Datenanalyse immer billiger und leistungsfähiger werden. Um KI richtig einzusetzen, müssen Forschende jedoch ein gutes Verständnis für die Bildgebung haben und ihre Grenzen kennen. Neulinge können leicht getäuscht werden – aber die Forschenden sind dafür verantwortlich, dass sie die richtige Ausbildung erhalten. Aus diesem Grund bietet das Center for Imaging der EPFL Kurse und Sommerprogramme an.

Die Bildgebung ermöglicht es Wissenschaftlerinnen und Wissenschaftlern, das Unsichtbare auf allen Ebenen zu sehen, aber kann die KI auch Dinge erschaffen, die es nicht gibt, wie bei den Deepfakes?

Das kommt ganz darauf an, wie sie eingesetzt wird. Deepfakes an sich sind keine Bedrohung, aber sie könnten eine sein, wenn sie unsachgemäss verwendet werden, z. B. wenn sie in den sozialen Medien viral gehen. Fotos werden schon seit langem manipuliert, um Bilder von Szenen zu erzeugen, die es gar nicht gibt. Aber Fotos sollen im Allgemeinen ansprechend sein – sie müssen nur visuell plausibel sein. Wissenschaftliche Bilder hingegen sind nicht auf Ästhetik ausgerichtet. Sie werden verwendet, um einen physikalischen Prozess objektiv zu messen oder zu visualisieren, d. h. sie müssen physikalisch realistisch sein. Sie sollen einen Einblick in das geben, was Forschende untersuchen.

Heisst das, dass nur optische Bildgebung echte Bilder erzeugen kann?

Ja, aber auch optische Bilder können durch einen Fehler bei der Datenerfassung beeinträchtigt werden. Ein weiteres Problem bei optischen Bildern ist, dass sie Rauschen enthalten, das durch Rekonstruktion entfernt werden muss. Wenn dies nicht korrekt geschieht, können die Bilder verfälscht werden. Optische Bilder sind jedoch zuverlässiger als von der KI erzeugte Bilder.

Ist die Rechenleistung ein Hindernis?

Es dauert sehr lange, neue KI-Modelle zu entwickeln, und man muss Algorithmen mit Milliarden von Parametern trainieren, was enorme Rechenleistung erfordert. Aus diesem Grund tun dies nur Schwergewichte wie OpenAI und Meta. Aber die von ihnen verwendeten Basismodelle können alles generieren, einschliesslich Text, Bilder, Ton und Video. In der wissenschaftlichen Forschung verwenden wir jedoch Modelle, die nur für eine einzige Aufgabe entwickelt wurden, z. B. für die Erkennung von Brustkrebs oder die Rekonstruktion von MRT-Scans. Diese benötigen viel weniger Rechenleistung. Die SwissAI-Initiative hat zum Ziel, solche Single-Task-Modelle zu entwickeln.

Wie kann die KI verbessert werden?

Ein grosses Problem ist, dass die Daten für das Training von KI-Programmen kommentiert werden müssen. Wenn man zum Beispiel einem einjährigen Kind drei Bilder einer Katze zeigt, wird es eine Katze erkennen können. Aber um einen Algorithmus zu trainieren, braucht man Tausende von Bildern, die von einem Menschen mit Kommentaren versehen wurden, um anzugeben, was auf dem Bild zu sehen ist, damit das Programm richtig lernt. Wenn man die Daten, die zum Trainieren eines Algorithmus verwendet werden, nicht mit Kommentaren versieht, ist dieser dreimal weniger genau. Bei dieser Art des selbstüberwachten Lernens sind Fortschritte dringend erforderlich, denn im Moment können wir KI nicht in Anwendungen einsetzen, für die wir nicht viele Daten haben. Dieser Fortschritt wird sich nicht sofort einstellen, aber er wird kommen.

Wie sieht die Zukunft aus?

Wenn ich in die Zukunft sehen könnte, hätte ich bereits mein eigenes Unternehmen gegründet! Scherz beiseite, ich glaube, dass die KI uns helfen wird, eine bessere Datenerfassungstechnologie zu entwickeln. Wie ich bereits erwähnt habe, bilden KI und Bildgebungstechnologie einen positiven Kreislauf: Bessere Sensoren führen zu einer besseren Analyse, und eine bessere Analyse führt zu verbesserten Sensoren, und so weiter. Diese positive Dynamik wird zu Durchbrüchen in allen Bereichen der Bildgebung führen, einschliesslich der räumlichen und zeitlichen Auflösung. Wenn die Bildgebung Fortschritte macht, macht auch die Wissenschaft Fortschritte.