13. Mai 2024
Ausgangslage und Fragestellung
Die Weltwirtschaft ist stark von der Verfügbarkeit von Rohstoffen abhängig, welche durch global verteilte logistische, meteorologische und geopolitische Einflüsse beeinträchtigt wird. Traditionelle Informationsquellen wie Inventurberichte, Wettervorhersagen und Satellitendaten stossen oft an ihre Grenzen bezüglich Zugänglichkeit, Aktualität und Zuverlässigkeit.
Demgegenüber bieten Nachrichtenpublikationen eine reichhaltige, vielfältige und zeitnahe Einsicht über derartige Einflüsse. Jedoch werden täglich etwa 50.000 Nachrichten zu Rohstoffen publiziert und die Bewältigung dieses Datenvolumens stellt eine grosse Herausforderung dar. Die zentrale Fragestellung dreht sich, um die Möglichkeiten zur Verarbeitung dieser Informationsflut mit dem Ziel die Verfügbarkeit von Rohstoffen besser einzuschätzen und frühzeitige Massnahmen ergreifen zu können.
Theorie
Die Theorie legt dar, dass mit den Fortschritten im Bereich der natürlichen Sprachverarbeitung, insbesondere durch die Einführung der grosser Sprachmodelle (engl. Large Language Models, LLM) neue Möglichkeiten zur Verarbeitung dieser riesigen Textdatenmengen entstehen. Allerdings zeigen empirische Beobachtungen, dass LLMs bei der Klassifizierung der Auswirkungen spezifischer Ereignisse auf die Verfügbarkeit bestimmter Rohstoffe an ihre Grenzen stossen.
Ein zentrales Problem ist die ethische, moralische und umweltbezogene Bewertung von Nachrichten durch LLMs, die nicht immer die tatsächlichen Auswirkungen auf die Verfügbarkeit und somit den Marktwert eines Rohstoffs widerspiegeln. Ein beispielhaftes Szenario ist, dass LLMs einen tragischen Unfall auf einer Ölplattform, der zu Verletzungen und sogar Todesfällen führt, aufgrund moralischer Überlegungen als negativ klassifizieren. Jedoch wirkt sich solch ein Vorfall in der Realität zu einer Abnahme des Angebots aus und hat somit einen positiven Einfluss auf den Ölpreis.
Ein weiteres Beispiel ist die Entdeckung neuer Ölvorkommen. Während Entdeckungen generell als positive Ereignisse wahrgenommen und dementsprechend von LLMs positiv klassifiziert werden, haben sie in der Realität oft einen gegenteiligen Effekt auf die Preise von Rohstoffen. Die Entdeckung neuer Ölquellen führt zu der Erwartung eines erhöhten Angebots auf dem Markt, was in der Regel zu einer negativen Änderung der Ölpreise führt.
Diese Dynamik wird von herkömmlichen LLMs auch mit optimierten Prompts nicht immer zuverlässig erfasst, da sie primär auf die allgemeine Stimmung der Nachrichten und nicht auf die spezifischen ökonomischen Implikationen fokussiert sind.
Methode
Um diese Limitation zu adressieren, stellt das NewsForce Forschungsprojekt einen innovativen Ansatz vor, der moderne Sprachmodelle mit ökonomischen Modellen kombiniert. Durch die Entwicklung von rohstoffspezifischen Sprachmodellen, wie CrudeBERT, welche für den Rohölmarkt ausgelegt ist. Dadurch konnte das Sprachmodell das komplexe Wechselspiel zwischen Angebot und Nachfrage auf dem Erdölmarkt genauer erfassen und dadurch die Verfügbarkeit von Erdöl pragmatisch abschätzen.
Ergebnis
Im Rahmen vom Forschungsprojekt NewsForce wurde bisher ein Konferenzpaper [1], ein Journalartikel [2] und ein Buchbeitrag [3] veröffentlicht. Darüber hinaus wurde die Weiterentwicklung durch das BRIDGE PoC [4] finanziert und befindet sich in der zweiten Hälfte der Laufzeit. Die nächsten Schritte beinhalten Entwicklung von Sprachmodellen für weitere Rohstoffe und die Konstruktion eines intuitiven Dashboards.
[1]https://arxiv.org/abs/2305.06140
[2]https://link.springer.com/article/10.1007/s12559-023-10129-4