Nahezu täglich sehen wir Nachrichten, welche neusten Test die LLMs gelöst haben - und die Tests sind häufig sehr komplex, wie z.B. Zulassungsprüfungen von Anwälten oder medizinische Examina. Doch gleichzeitig ist es verblüffend, an welchen einfachen Fragen LLMs scheitern. Tyler Cowen schrieb, dass die LLMs die für die Menschen mit Internetzugang einfache Frage nicht richtig beantworten Name three famous people who all share the exact same birth date and year Das Scheitern der LLMs, diese und ähnlich einfachen Fragen zu beantworten, kann uns wichtige Hinweise liefern, wie diese funktionieren. Es ist vielleicht am besten zu sagen, dass LLMs unglaubliche Intuition, aber begrenzte Intelligenz zeigen. Sie können fast jede Frage beantworten, die in einem intuitiven Durchgang beantwortet werden kann. Und mit ausreichend Trainingsdaten und genügend Schritten können sie sich einer Art von begründeter Intelligenz annähern. Mit anderen Worten, es gibt eine "Zielverschiebung", bei der,...
Jede empirische Studie ist so gut wie die Daten (und Methoden), die sie nutzt. Für empirische Kapitalmarktforschung sind naturgemäß die Kapitalmarktdaten wichtig. Datastream gehört zu den wichtigsten Datenbanken für Kapitalmarktdaten. Sie bietet den Zugang zur Vielzahl von Wertpapieren mit historisch lange zurückreichenden Zeitreihen (wichtig für Backtests) an. In diesem Blog (eher ein Vlog) erläutre ich, wie wir auf dem schnellsten Weg wichtigsten Informationen aus Datastream beziehen können.
Für eine neue Nutzerin von Datastream (DS) sind aus meiner Sicht drei Elemente wichtig. Erstens, sie muss wissen, für welche Wertpapiere sie Daten erheben will. Über DS können wir u.a. Informationen zu Aktien, Aktienindizes, Anleihen, Anleihenindizes, CDS, Optionen, Optionsscheine, Futures, Währungen, makroökonomische Daten etc. beziehen. Zweitens, sie will ganz sicher eine DS-Liste erstellen. Die DS-Liste macht uns das Leben sehr einfach. Sie umfasst eine Tabelle von Wertpapieren einer Gattung, für die wir uns interessieren. Anstatt dann beispielsweise für jede Aktie die Daten einzeln zu erheben, können wir mithilfe der DS-Liste für alle Wertpapiere auf dieser Liste durch einen einzelnen Aufruf alle Daten beziehen. Drittens, sie will sowohl statische als auch dynamische Abfragen in DS verwenden, um möglichst bequem an die Daten zu kommen.
Ich habe mehrere Videos zu diesen drei Punkten erstellt und daraus eine Youtube-Playlist gemacht. In den Videos gehe ich auf die genannten Punkte ein, warum sie wichtig sind und vor allem, wie wir sie in DS konkret umsetzen können. Die Videos sind ohne die mittlerweile obligatorischen Aufrufe, den Chanel zu abonnieren, auch wenn ich mich darüber natürlich freue. Jeder Cent aus den Einnahmen geht in die Finanzierung des jährlichen ‚Bestenempfangs‘, zu dem ich die besten Studierenden eines Jahrganges zum Kennenlernen und Austausch einlade.
Zwei weitere praktische DS-Tipps an dieser Stelle. Erstens, es ist am besten, für jede Variable (in DS nennen wir sie Datentyp) einzeln eine Excel-Tabelle anzulegen (natürlich unter der Nutzung der eigenen DS-Liste). Die Reihenfolge der Wertpapiere ist durch die Liste immer identisch (DS geht einfach die Liste durch) und wir müssen uns später nicht mit der Trennung der Variablen beschäftigen. Zweitens, es macht uns das Leben sehr einfach, wenn wir alle Variablen in der gleichen Frequenz abfragen. D.h. selbst wenn ich tägliche Aktienkurse und die an sich jährlichen Bilanzdaten benötige, ist es sinnvoll, auch die Bilanzdaten in täglicher Frequenz abzufragen. Die identische Frequenz spart das äußerst fehlerträchtige Matchen der Daten hinterher.
In der nächsten Kurzeinführung werde ich die Nutzung der sog. ‚Request Tables‘ beschreiben. Danach werde ich die Erstellung von DS-Listen im Detail erläutern, vor allem im Hinblick auf wissenschaftliches Arbeiten.
Comments
Post a Comment