Topologische Datenanalyse kann helfen, Börsencrashs vorherzusagen

EPFL-Wissenschaftlerinnen und -Wissenschaftler haben zusammen mit dem lokalen Startup L2F ein belastbares Modell entwickelt das, basierend auf Methoden eines Zweigs der Mathematik, der topologischen Datenanalyse, vorhersagen kann, wann eine Systemverschiebung bevorsteht.

Anne-Muriel Brouet 06.04.2021

Bei der topologischen Datenanalyse (TDA) geht es darum, Informationen aus Wolken von Datenpunkten zu extrahieren und diese Informationen zu nutzen, um beispielsweise Daten zu klassifizieren, Muster zu erkennen oder Trends vorherzusagen. Ein Forschungsteam des EPFL-Labors für Topologie und Neurowissenschaften, L2F (ein EPFL-Spin-off) und HEIG-VD, die an einem Projekt arbeiteten, das zum Teil durch ein Innosuisse-Stipendium finanziert wurde, nutzte TDA, um ein Modell zu entwickeln, das vorhersagen kann, wann ein System eine grössere Veränderung erfährt. Ihr Modell, giotto-tda genannt, ist als Open-Source-Bibliothek verfügbar und kann Analysten helfen, zu erkennen, wann Ereignisse wie ein Börsencrash, ein Erdbeben, ein Verkehrsstau, ein Staatsstreich oder eine Fehlfunktion einer Zugmaschine bevorstehen.

Katastrophen und andere unerwartete Ereignisse sind per Definition Fehlentwicklungen – das macht sie mit herkömmlichen Modellen schwer vorhersagbar. Das Forschendenteam nutzte daher die Methoden der TDA, um einen neuartigen Ansatz zu entwickeln, der auf der Tatsache basiert, dass, wenn ein System einen kritischen Zustand erreicht, z. B. wenn Wasser im Begriff ist, zu Eis zu erstarren, die Datenpunkte, die das System repräsentieren, beginnen, Formen zu bilden, die seine Gesamtstruktur verändern. Durch genaue Beobachtung der Datenpunktwolken eines Systems können Wissenschaftlerinnen den Normalzustand des Systems identifizieren und somit feststellen, wann eine abrupte Änderung bevorsteht. Ein weiterer Vorteil der TDA ist, dass sie unempfindlich gegenüber Rauschen ist, d.h. die Signale werden nicht durch irrelevante Informationen verfälscht.

Bisher wurde TDA vor allem für Datensätze mit klarer topologischer Struktur verwendet, wie z.B. in der medizinischen Bildgebung, der Strömungsmechanik, den Materialwissenschaften und der 3D-Modellierung (z.B. in der Molekularchemie und Zellbiologie). Mit giotto-tda kann die Methode jedoch für die Modellierung nahezu aller Arten von Datensätzen (z. B. Gravitationswellen) verwendet werden. Die in diesen Datensätzen enthaltenen Daten füttern den Machine-Learning-Algorithmus des Modells, verbessern die Genauigkeit seiner Vorhersagen und liefern Warnhinweise.

Durch genaue Beobachtung der Datenpunktwolken eines Systems können Forschende den Normalzustand des Systems identifizieren. © DR

Rauschen und verworrene Signale

Die Wissenschaftlerinnen und Wissenschaftler testeten giotto-tda an den Börsencrashs der Jahre 2000 und 2008. Sie betrachteten die täglichen Kursdaten des S&P 500 – ein Index, der üblicherweise als Massstab für den Zustand des Finanzmarktes herangezogen wird – von 1980 bis heute und verglichen sie mit den von ihrem Modell generierten Prognosen. Die preisbasierte Grafik zeigte zahlreiche Spitzen, die das Warnniveau im Vorfeld der beiden Crashs überschritten. «Herkömmliche Prognosemodelle enthalten so viel Rauschen und geben so viele Signale, dass man nicht wirklich weiss, welchen Signalen man folgen soll», sagt Matteo Caorsi, Leiter des Projektteams bei L2F. «Wenn man auf sie alle hört, wird man am Ende nie investieren, denn es gibt nur sehr wenige Zeiten, in denen die Signale wirklich klar sind.»

Aber die Signale waren mit giotto-tda sehr klar, da die Spitzen, die auf die bevorstehenden Crashs hinwiesen, weit über dem Warnniveau lagen. Das bedeutet, dass TDA eine robustere Methode ist, um volatile Bewegungen zu erkennen, die auf einen bevorstehenden Crash hinweisen können. Da die Ergebnisse der Forschenden jedoch nur einen bestimmten Markt und einen kurzen Zeitraum betreffen, plant das Team mit Hilfe eines weiteren Innosuisse-Stipendiums weitere Forschungen: «Der nächste Schritt wird sein, TDA auf Deep-Learning-Methoden anzuwenden. Das wird uns wertvolle Informationen über unser Modell geben, wie interpretierbar seine Ergebnisse sind und wie robust es ist», sagt Caorsi.