EPFL-Tool zeigt Verfall des politischen Umgangstons in den USA
Eine grosse Mehrheit der Amerikanerinnen und Amerikaner glaubt, dass der Umgangston und die Art der politischen Debatte in den Vereinigten Staaten in den letzten Jahren negativer geworden sind, und mehr als die Hälfte hat den Eindruck, dass Donald Trump dafür verantwortlich ist.
Aber spiegeln diese subjektiven Eindrücke den wahren Zustand des politischen Diskurses in den USA wider? Da sich die Politik auf nahezu jeden Aspekt unseres persönlichen Lebens auswirkt, hat die Antwort auf diese Frage wichtige gesellschaftliche Auswirkungen, unter anderem auf den Grad der Unterstützung für politische Institutionen und deren wahrgenommene Legitimität, was zu einem Rückgang des Vertrauens in politische Prozesse führt.
Bislang gab es nur wenige datengestützte Belege für die wahrgenommene Verschiebung hin zu einem negativeren politischen Ton, was zum Teil darauf zurückzuführen ist, dass es schwierig ist, eine umfassende, längsschnittliche Aufzeichnung der Aussagen von Politikerinnen und Politikern zu erhalten. Nun haben Forschende des Data Science Lab (DLAB), das zur Fakultät für Computer- und Kommunikationswissenschaften gehört, eine neue Datenbank, die Quotebank, entwickelt und können damit analysieren, wie sich der Tonfall von US-Politikerinnen und -Politikern, wie er in Online-Medien wiedergegeben wird, zwischen 2008 und 2020 entwickelt hat.
Quotebank enthält einen Korpus von fast einer Viertelmilliarde (235 Millionen) einzigartiger Zitate, die aus 127 Millionen Online-Nachrichtenartikeln extrahiert wurden, die von einer umfassenden Reihe von Online-Nachrichtenquellen über einen Zeitraum von fast 12 Jahren veröffentlicht wurden. Ein Algorithmus für maschinelles Lernen ordnet die Zitate dann automatisch den Sprecherinnen und Sprechern zu, die sie wahrscheinlich geäussert haben.
In der Studie, die in Nature Scientific Reports veröffentlicht wurde, konzentrierten sich die Forschenden auf US-Politikerinnen und -Politiker und ermittelten eine Teilmenge von 24 Millionen Zitaten von 18 627 Sprechenden, die mit biografischen Informationen aus der Wissensdatenbank Wikidata angereichert wurden. Da zuvor kein vergleichbarer Datensatz mit Zitaten von Sprechenden zur Verfügung stand, ermöglichte es die Quotebank den Forschenden, den Tonfall der öffentlichen Sprache von US-Politikerinnen durch die Brille der Online-Nachrichtenmedien zu analysieren, und zwar in einer Repräsentativität und Vollständigkeit, die zuvor unmöglich war.
Negativität bestätigt
«Um die Prävalenz negativer Sprache im Laufe der Zeit zu quantifizieren, haben wir etablierte psycholinguistische Instrumente verwendet, um jedes Zitat hinsichtlich seines emotionalen Inhalts zu bewerten, die Zitate nach Monaten zusammengefasst und mit den daraus resultierenden Zeitreihen gearbeitet», erklärt Professor Robert West, Leiter des DLAB.
«Wir fanden heraus, dass während der Amtszeit von Barack Obama im Weissen Haus die Häufigkeit von Wörtern mit negativen Emotionen kontinuierlich abnahm, dann aber plötzlich mit den Vorwahlen 2016 sprunghaft anstieg. Wenn man die Zitate von Donald Trump aus den Daten herausnimmt, ist der Anstieg der Wörter mit negativen Emotionen im Juni 2015, als Trump seine Kampagne startete, um 40 % zurückgegangen. Andersherum betrachtet, erhöhte sich die Effektgrösse durch Trumps Zitate um 63 %. Trump war also eindeutig der Haupttreiber des Effekts, wenn auch nicht der einzige», so West weiter.
Die Ergebnisse bestätigen objektiv den subjektiven Eindruck der meisten Amerikaner, dass in den letzten Jahren tatsächlich ein tiefgreifender und dauerhafter Wandel hin zu einem negativeren Ton in der Sprache von US-Politikern stattgefunden hat, wie er sich in den Online-Nachrichten widerspiegelt, und dass das Auftreten von Donald Trump in der politischen Arena eher mit einem Richtungswechsel als mit einer Fortsetzung bereits bestehender Trends im politischen Ton verbunden war.
«Unsere Ergebnisse haben Auswirkungen darauf, wie wir sowohl die Vergangenheit als auch die Zukunft der US-Politik sehen. Sie verdeutlichen die Symptome der wachsenden Toxizität in der US-Politik aus einem neuen Blickwinkel und zeigen die zukünftige Gefahr einer positiven Rückkopplungsschleife der Negativität auf. Wege zu finden, um aus diesem Kreislauf der Negativität auszubrechen, ist eine der grossen Herausforderungen, vor denen die Vereinigten Staaten heute stehen», so West.
Quotebank
Der Artikel «United States politicians' tone became more negative with 2016 primary campaigns» war der erste, der unter Verwendung von «Quotebank», dem einzigartigen neuen Tool des DLAB, veröffentlicht wurde, und es sind weitere Forschungsprojekte in Vorbereitung. Das Team begann 2017 mit der Arbeit an der Plattform, indem es künstliche Intelligenz zur Extraktion des Datensatzes einsetzte und dann das Open-Source-Framework BERT Natural Language Processing von Google für die spezielle Aufgabe der Zuordnung von Zitaten zu Sprechenden feinabstimmte.
Der Datensatz enthält zwei Arten von Daten: zitatzentrierte Daten, bei denen Zitate über alle ihre Vorkommen in den Nachrichten aggregiert werden, und artikelzentrierte Daten: Jeder Eintrag in diesem Datensatz ist ein Nachrichtenartikel, der ein oder mehrere Zitate enthält.
Akhil Arora, ein Doktorand im DLAB, dessen Forschung sich auf die Quotebank konzentriert hat, sagt, er sei stolz darauf, zur Entwicklung eines Instruments beigetragen zu haben, das sehr zugänglich ist und eine Schlüsselrolle bei der Wahrung der Demokratie spielen kann. Er würdigte auch die Beiträge von Jozef Coldenhoff, einem Masterstudenten des DLAB, der eine wichtige Rolle bei der Einführung des Tools spielte.
«Diese Daten waren schon immer für Programmierer zugänglich, aber mit dieser Schnittstelle kann nun jeder sie erkunden. Ich denke, dass die Zitatebank sehr nützlich für die Rechenschaftspflicht und für die einfache Überprüfung von Fakten ist. Zum ersten Mal haben wir ein offen zugängliches, scharfes Instrument, mit dem man alle Fakten über die Äusserungen einer Person herausfinden kann, und das ist in der Politik so wichtig», sagte Arora, «ein weiterer Aspekt ist die Reflexivität. Journalistinnen und Journalisten zum Beispiel sind sich vielleicht gar nicht bewusst, dass sich ihr Fachgebiet im Laufe der Zeit verschlechtert hat, und die Trump-Studie zeigt deutlich, dass die Verwendung von unsachlicher Sprache zugenommen hat.»
West stimmt dem zu. Eine Einschränkung von Quotebank besteht darin, dass der Datensatz statisch ist, und er sieht das Potenzial für Partnerschaften zur Überwindung von Herausforderungen beim Datenzugang.
«Unsere Technologie ist unkompliziert. Anstatt dass wir Daten in unseren Algorithmus einpflegen, könnten Google News oder Reuters oder Bloomberg, die Nachrichten sammeln und öffentlich zugänglich machen, unseren Algorithmus nutzen und eine Schnittstelle für Zitate in ihre Datenbank einbauen. Das wäre das ideale Szenario und würde uns ein laufendes Barometer für den Zustand unserer Demokratie und unserer Informationsstrukturen liefern, so dass wir handeln könnten, wenn etwas schief läuft», so Arora.