KI enthüllt, wie Glukose dem SARS-CoV-2-Virus hilft
Eine Gruppe im Blue Brain-Projekt hat ein KI-Tool entwickelt, das Hunderttausende von wissenschaftlichen Artikeln lesen, das Wissen extrahieren und die Antwort zusammenstellen kann – «A machine-generated view of the role of blood glucose levels in the severity of COVID-19» (Eine maschinell erstellte Darstellung der Rolle des Blutzuckerspiegels bei der Schwere von COVID-19) wurde heute in Frontiers in Public Health, Clinical Diabetes veröffentlicht.
Als Reaktion auf die COVID-19-Pandemie wurde der offene COVID-19-Forschungsdatensatz (CORD-19) mit über 400 000 wissenschaftlichen Artikeln zugänglich gemacht, darunter mehr als 150 000 Volltextartikel zu COVID-19, SARS-CoV-2 und anderen Coronaviren. Der CORD-19-Datensatz ist die bisher umfangreichste Coronavirus-Literatursammlung, die für Data Mining zur Verfügung steht, und die dahinter stehende Koalition hat KI-Experten aufgefordert, ihre Fähigkeiten in der Verarbeitung natürlicher Sprache und anderen Techniken des maschinellen Lernens einzusetzen, um neue Erkenntnisse zu gewinnen, die im laufenden Kampf gegen COVID-19 hilfreich sein können.
«Seit Anfang 2020 leistet Blue Brain einen proaktiven Beitrag zum Kampf gegen COVID-19», erklärt Prof. Henry Markram, Gründer und Direktor des Blue Brain Project, und fügt hinzu: «Mit diesem Aufruf zum Handeln haben wir erkannt, dass wir unsere Technologien des maschinellen Lernens und unsere Expertise im Bereich Data und Knowledge Engineering nutzen können, um Text- und Data-Mining-Tools zu entwickeln, die der medizinischen Gemeinschaft helfen können. Blue Brain hat es sich zur Aufgabe gemacht, einen der rätselhaftesten Aspekte dieser Pandemie zu beantworten – nämlich warum einige Menschen sehr krank werden, während andere davon völlig unberührt bleiben».
Aufbau und Nutzung der Text- und Data-Mining-Tools
Dementsprechend hat Blue Brain Machine-Learning-Modelle entwickelt und trainiert, um diese Artikel zu analysieren und strukturierte Informationen aus Textquellen zu extrahieren. Eine einfache Analyse des CORD-19v47-Datensatzes mit der Textmining-Toolbox «Blue Brain Search» ergab, dass alle Artikel auf den Glukosestoffwechsel als die am häufigsten erwähnte biologische Variable hinwiesen.
Mithilfe von Blue Graph, einem vereinheitlichenden Python-Framework, das extrahierte Textkonzepte analysiert, um Wissensgraphen zu erstellen, konstruierte die Gruppe spezifische Wissensgraphen, um sich auf alle Erkenntnisse zu konzentrieren, die Glukose im Zusammenhang mit Atemwegserkrankungen, Coronaviren und COVID-19 betrachteten. Auf diese Weise konnte die potenzielle Rolle der Glukose auf vielen Ebenen erforscht werden, von den oberflächlichsten symptomatischen Assoziationen bis hin zu den tiefgreifenden biochemischen Mechanismen, die bei der Krankheit eine Rolle spielen.
Aus den Fakten und Ergebnissen von Tausenden von Veröffentlichungen ergaben sich mehrere Hinweise darauf, dass erhöhte Blutzuckerwerte entweder durch einen anormalen Glukosestoffwechsel verursacht oder während eines Krankenhausaufenthalts, einer medikamentösen Behandlung oder durch eine intravenöse Verabreichung induziert wurden. Dieser Ansatz korrelierte sehr gut mit dem Schweregrad der COVID-19-Infektion in der gesamten Bevölkerung und zeigte, wie ein erhöhter Blutzuckerspiegel praktisch jeden Schritt der Virusinfektion unterstützt, vom Beginn in der Lunge bis hin zu schweren Komplikationen wie dem akuten Atemnotsyndrom, Multiorganversagen und thrombotischen Ereignissen.
«In der Studie erörtern wir die möglichen Konsequenzen dieser Hypothese und schlagen Bereiche für die weitere Erforschung von Diagnostik, Behandlung und Interventionen vor, die dazu beitragen könnten, den Schweregrad von COVID-19 zu verringern und die Auswirkungen der Pandemie auf die öffentliche Gesundheit zu bewältigen», erklärt Dr. Emmanuelle Logette, Molekularbiologin bei Blue Brain.
Das Potenzial von frei zugänglichen wissenschaftlichen Veröffentlichungen
«Als die Pandemie ausbrach, machten sich die Wissenschaftlerinnen und Wissenschaftler sofort an die Arbeit und veröffentlichten innerhalb eines Jahres über hunderttausend Arbeiten. Aber kann jemand so viele Arbeiten lesen? Zum Glück hat die Koalition hinter dem CORD-19-Datensatz alle Abonnementverlage davon überzeugt, diese Arbeiten über die Abo-Mauer zu bringen und sie offen zugänglich zu machen, so dass sie mit modernen Technologien für maschinelles Lernen und Knowledge Engineering ausgewertet werden können», so Prof. Henry Markram.
«Mit dem Zugriff auf den CORD-19-Datensatz hat Blue Brain schnell ein KI-Tool zusammengestellt und es gezielt eingesetzt, um herauszufinden, warum manche Menschen krank werden und andere nicht. Reicht es aus, nur zu sagen, dass ältere Menschen anfälliger sind? Wir müssen herausfinden, warum. Warum sterben einige scheinbar gesunde Menschen an COVID-19? Warum sterben so viele Menschen auf der Intensivstation? Um diese Fragen zu beantworten, haben wir unsere KI angewiesen, jeden Schritt der Virusinfektion zu verfolgen, von dem Moment an, in dem das Virus in die Lunge eindringt, bis zu dem Zeitpunkt, an dem es aus den Zellen in der Lunge ausbricht und sich im ganzen Körper ausbreitet, um die Organe zu infizieren», erklärt Prof. Markram, «wir haben das Virus auch auf atomistischer Ebene nachgebaut und ein Computermodell der Infektion entwickelt, so dass wir versuchen konnten, zu überprüfen, was in der Literatur zu lesen war. Ich glaube, wir haben den wahrscheinlichsten Grund gefunden, warum manche Menschen kränker werden als andere.»
Ein Beispiel hierfür ist die Verwendung von Blue Brain BioExplorer durch das Team, um die wichtigsten Auswirkungen eines hohen Glukosegehalts in der Oberflächenflüssigkeit der Atemwege auf den ersten Schritt der Infektionen in der Lunge visuell darzustellen und die erhöhte Anfälligkeit für Atemwegsviren bei Risikopatienten zu erklären.
Der Blue Brain BioExplorer wurde entwickelt, um die Struktur und Funktion des Coronavirus für diese Studie zu rekonstruieren, zu visualisieren, zu erforschen und detailliert zu beschreiben, und steht anderen als Open Source zur Verfügung, um wichtige wissenschaftliche Fragen zu beantworten.
«Die Pionierarbeit in der Simulationsneurowissenschaft zum besseren Verständnis des Gehirns hat zahlreiche Nebeneffekte», sagt Prof. Markram, «Diese Studie zeigt, wie die Computertechnologien von Blue Brain und das einzigartige Team von multidisziplinären Experten schnell zur Hilfe in einer globalen Gesundheitskrise eingesetzt werden können.»
Ein wichtiger Schritt für die Wissenschaft und das Verständnis des Gehirns
«Die COVID-19-Studie zeigt auch, warum wir glauben, dass computergestützte Werkzeuge so wichtig sind, um das Gehirn zu verstehen», erklärt Prof. Markram, «Das Problem ist sogar noch grösser. Es gibt mehrere Millionen wissenschaftliche Arbeiten, die man lesen und verstehen müsste, um herauszufinden, was wir über das Gehirn wissen. Weiss denn überhaupt jemand, was wir wissen? Aber Maschinen können so viele Arbeiten lesen. Aus diesem Grund hat das Blue Brain einige der fortschrittlichsten Technologien zur Wissensverarbeitung, Mathematik und zum maschinellen Lernen entwickelt. Damit ist allerdings nur ein Teil der Herausforderung gelöst. Mit einem KI-Tool, das all diese Arbeiten lesen kann, wüssten wir immer noch nur einen kleinen Bruchteil dessen, was das Gehirn enthält und wie es funktioniert. Aber der Aufbau von Modellgehirnen unter Verwendung von Konstruktionsprinzipien hilft uns bei dem Versuch, das Bild zu vervollständigen», sagt er abschliessend.
Ist es richtig, die Wissenschaft nur während einer Pandemie zu öffnen?
Prof. Markram brachte auch seine Frustration über die allzu häufige Praxis der Sperrung wissenschaftlicher Erkenntnisse durch Abonnementverlage zum Ausdruck: «Als uns der CORD-19-Literaturdatensatz zur Verfügung gestellt wurde, konnten wir bei Blue Brain unsere Technologie auf COVID-19 ausrichten und eine Antwort auf eine wichtige Frage im Kampf gegen dieses tödliche Virus vorschlagen. Ist es daher richtig, wissenschaftliche Arbeiten (die mit öffentlichen Mitteln finanziert werden) nur während einer Pandemie der Öffentlichkeit zugänglich zu machen, wenn dieselbe Art von Techniken auch zur Bekämpfung so vieler anderer Krankheiten, zur Beschleunigung der Wissenschaft und zur Rettung des Planeten vor dem Klimawandel eingesetzt werden kann?»