Machine Learning-Algorithmen erfreuen sich bei Wissenschaftlern und Praktikern zunehmender Beliebtheit, während sie herauszufinden versuchen, ob sie höhere Renditen ermöglichen. Das Quant-Team von Robeco hat vor diesem Hintergrund untersucht, was die Anwendung solcher Algorithmen für Aktienanlagen in Schwellenländern bedeuten würde.1 Die Ergebnisse waren ebenso nützlich wie die Modelle des Machine Learnings selbst.
Wir fanden heraus, dass sie sich durch die Erkennung von finanziell relevanten, nicht-linearen Beziehungen zwischen Unternehmensmerkmalen auszeichnen. Diese Leistung wäre für menschliche Research-Experten eine Herausforderung. Wir haben auch festgestellt, dass die Nutzung von „Ensembling“ oder der „Weisheit der Masse“ bei Machine Learning-Modellen die erwarteten Renditen nach Abzug der Handelskosten für Aktienanleger um bis zu 2%-Punkte pro Jahr erhöhen kann.
Die Ergebnisse stammen aus der Analyse von mehr als 15.000 Einzelaktien aus 32 Ländern im Zeitraum zwischen 1990 und 2021. Wir haben für die Studie 36 Standardmerkmale verwendet, die sowohl für entwickelte als auch für aufstrebende Länder gelten können. Verzichtet haben wir auf die Einführung neuer Merkmale, um den Mehrwert hervorzuheben, den Machine Learning-Techniken bringen können. Dadurch wurde sichergestellt, dass die erzielte zusätzliche Wertentwicklung nicht lediglich auf neue Daten zurückzuführen ist, sondern auf bekannte Faktoren wie Low-risk, Valuation, Momentum und Quality.
Anschließend wurden verschiedene Algorithmen zur Vorhersage der relativen Aktienrenditen im Vergleich zum Marktindex des jeweiligen Landes auf Grundlage dieser Faktoren eingesetzt. Bei der am wenigsten komplexen Methode wird davon ausgegangen, dass jedes der Unternehmensmerkmale eine lineare Beziehung zur Outperformance der Aktien aufweist.
Drei Machine Learning-Methoden wurden verwendet, um eine Verbesserung gegenüber einer einfachen linearen Regression zu erzielen.
Elastic Net. Diese Methode zielt darauf ab, die Anzahl der Merkmale (in unserem Fall 36) zu reduzieren, indem diejenigen mit der geringsten oder keiner Prognosefähigkeit ausgesondert werden. Sie minimiert auch das mögliche Rauschen in einer Probe, welches die Prognosefähigkeit beim Einsatz außerhalb der Probe beeinträchtigen könnte. Mit dieser Methode lassen sich keine datenbedingten nicht-linearen Beziehungen oder Interaktionseffekte feststellen.
Baumbasierte Verfahren. Random Forests und Gradient-boosted Regression Trees folgen der Idee, die zugrundeliegenden Daten sequentiell in Gruppen von Firmenmerkmalen zu unterteilen – und so einen Baum „wachsen“ zu lassen. Jedes Mal, wenn die Daten separiert werden, werden neue Zweige erstellt. Bei jeder neuen Verzweigung wird das Merkmal ausgewählt, das die größte Trennung in der Datenbank erzeugt. Dabei wächst der Baum so hoch, wie es der Researcher zulässt, in einem Blatt endend.
Neuronale Netze. Hierbei handelt es sich um flexible Modelle, die mehrere Ebenen miteinander verbinden. Sie bestehen aus einer Eingabeebene mit Firmenmerkmalen und mindestens einer versteckten Ebene aus Aktivierungsfunktionen. Eine Ausgabeebene aggregiert die Ergebnisse der verborgenen Ebenen zu einer Ertragsprognose. Verwendet ein Modell mehr als eine verborgene Ebene – unser Modell nutzt bis zu fünf – wird es manchmal als „Deep-Learning“-Modell bezeichnet.
Mit 1990 bis 2001 als Initialisierungszeitraum haben wir Daten aus der ersten Hälfte für das Training und aus der zweiten Hälfte für die Validierung verwendet. Wir trainierten die Modelle auf unserem gesamten Satz von Aktienrenditen der Schwellenländer. Auf die Entwicklung länderspezifischer Modelle verzichteten wir, da einiges darauf hindeutet, dass dies zu einer Überanpassung führen könnte, was die Prognosefähigkeit außerhalb der Stichprobe verringert.
Anschließend können wir jede der 36 Variablen nach ihrer Bedeutung aufreihen. Dabei evaluieren wir die negativen Auswirkungen auf die Prognoseleistung, wenn die Variable weggelassen wird und der Rest des Modells unverändert bleibt. Wir haben festgestellt, dass die Modelle ähnliche Entscheidungen hinsichtlich der einflussreichsten Merkmale treffen. Die drei wichtigsten sind der Kurs zum 52-Wochen-Hoch, die aktienspezifische Volatilität und die Umsatzhäufigkeit.
Momentum und Short-term Reversal sind ebenfalls unter den Top 15, ebenso wie das Kurs-Gewinn-Verhältnis und die Profitabilität. Dies sind wertvolle Informationen. Die Erkennung von Interaktionseffekten zwischen jeder der 36 Variablen wäre für einen menschlichen Forscher unglaublich zeitaufwendig und schwierig. Dagegen ist ein maschinelles Lernmodell imstande, diese Beziehungen schnell und systematisch zu finden.
Anlageerfolg
In der Theorie funktionieren sie also, aber wie wirken sich diese Interaktionseffekte auf den tatsächlichen Anlageerfolg aus? Für Anleger kann es wichtiger sein, die von diesen Modellen ausgehenden Signale einem Backtest zu unterziehen, um das Risiko und die Rendite von Portfolios vergleichen zu können.
Um dies zu testen, haben wir fünf Portfolios gebildet, die auf den maschinell vorhergesagten Überrenditen der einzelnen Aktien im Vergleich zum jeweiligen Länderindex basieren. Anschließend berechneten wir die Rendite im Folgemonat, wobei wir in jedem Portfolio eine auf der Marktkapitalisierung basierende Gewichtung verwendeten. Beginnend mit dem Zeitraum außerhalb der Stichprobe ab Januar 2002 wiederholten wir dies für jeden Monat bis Dezember 2021, dem Ende unserer Stichprobe. Die Ergebnisse sind in der nachstehenden Tabelle zu sehen.
Quelle: Robeco, Hanauer und Kalsbach (2023) anhand von Daten von Januar 2002 bis Dezember 2021
Die aus den beiden linearen Modellen, nämlich Regression und Elastic Net, abgeleiteten Renditen des Long/Short-Portfolios lagen im Durchschnitt bei rund 0,8 % pro Monat. Dies ist beachtlich und zeigt, dass herkömmliche quantitative Modelle Überschussrenditen an den Aktienmärkten der Schwellenländer erzielen können, was durch frühere Studien über Factor Investing in Schwellenländern bestätigt wird.
Die Random Forest- und die Gradient-Boosted-Random-Tree-Methode erzielten höhere Renditen von rund 1,0 % pro Monat. Dagegen lieferten die Methode der neuronalen Netze und eine Kombination aller maschinellen Lernmodelle eine Rendite von 1,2 %. Kurz gesagt: lineare Modelle sind gut, aber Machine Learning-Modelle sind besser.
Holen Sie sich die neuesten Einblicke
Abonnieren Sie unseren Newsletter, um aktuelle Anlageinformationen und Analysen durch Sachverständige zu erhalten.
Zurück zu den Grundlagen
Dies wirft die Frage auf, ob es sich hierbei nicht nur um eine besondere Art handelt, die herkömmlichen quantitativen Faktoren aufzugreifen, die seit Jahrzehnten in der Investmentbranche verwendet werden. Wie die roten Balken zeigen, kann ein erheblicher Teil der rohen Überrenditen durch diese bekannten Faktoren erklärt werden.
Einerseits bestätigt dies, dass das traditionelle Factor-Investing nach wie vor künftige Erträge vorhersagen kann. Andererseits zeigt es auch, dass Machine Learning-Modelle uns erweiterte, ökonomisch relevante Erkenntnisse liefern, die noch höhere Renditen ermöglichen. Die linearen Modelle zeigen, dass noch etwa 0,2 % pro Monat an Alpha zu erfassen sind. Dieser Wert erhöht sich auf 0,5 % pro Monat für die baumbasierten Modelle und 0,7 % pro Monat für die Methode des neuronalen Netzes und die Machine Learning-Gesamtheit.
Daher ist die Verwendung von Machine Learning-Signalen renditeträchtige als herkömmliches Factor Investing allein. Selbst wenn man die Transaktionskosten und Beschränkungen für Leerverkäufe berücksichtigt, zeigt sich, dass diese Prognoseart zu einer erheblichen Netto-Outperformance gegenüber dem Markt führen kann und Anlegern empfohlen werden kann.
Footnote
1Siehe Hanauer & Kalsbach, Machine learning and the cross-section of emerging market stock returns, in: Emerging Markets Review 55 (2023), 101022.
Dieser Artikel ist ein Auszug aus einem Spezialbeitrag in unserem 5-Jahres-Ausblick.
Lesen Sie alle Artikel und der Zusammenfassung auf DeutschDigitales Event: 5-Jahres-Ausblick “Dreifache Machtprobe“
Registrieren Sie sich für unser Event mit hochkarätiger Besetzung am 29. November