machine learning for trading Download - machine learning for trading Quellcode herunterladen

machine learning for trading

AI-Quellcode

2.0

Herunterladen

ML für den Handel – ^2. Auflage

Dieses Buch soll zeigen, wie ML auf praktische und dennoch umfassende Weise einen Mehrwert für algorithmische Handelsstrategien bieten kann. Es deckt ein breites Spektrum an ML-Techniken ab, von linearer Regression bis hin zu Deep Reinforcement Learning, und zeigt, wie man eine Handelsstrategie basierend auf Modellvorhersagen erstellt, backtestet und bewertet.

In vier Teilen mit 23 Kapiteln plus Anhang behandelt es auf über 800 Seiten :

wichtige Aspekte der Datenbeschaffung, des Financial Feature Engineering und des Portfoliomanagements,
das Design und die Bewertung von Long-Short -Strategien basierend auf überwachten und unüberwachten ML-Algorithmen ,
wie man handelbare Signale aus Finanztextdaten wie SEC-Einreichungen, Gewinnmitteilungsprotokollen oder Finanznachrichten extrahiert,
Verwendung von Deep-Learning -Modellen wie CNN und RNN mit Markt- und Alternativdaten, wie man synthetische Daten mit generativen gegnerischen Netzwerken generiert und wie man einen Handelsagenten mithilfe von Deep Reinforcement Learning trainiert

Dieses Repo enthält über 150 Notizbücher, die die im Buch besprochenen Konzepte, Algorithmen und Anwendungsfälle in die Tat umsetzen. Sie liefern zahlreiche Beispiele, die zeigen:

wie man mit Markt-, fundamentalen und alternativen Text- und Bilddaten arbeitet und Signale daraus extrahiert,
wie man Modelle trainiert und optimiert, die Renditen für verschiedene Anlageklassen und Anlagehorizonte vorhersagen, einschließlich der Replikation kürzlich veröffentlichter Forschungsergebnisse und
wie man Handelsstrategien entwirft, Backtests durchführt und bewertet.

Wir empfehlen dringend, beim Lesen des Buches die Notizbücher durchzulesen; Sie befinden sich normalerweise in einem ausgeführten Zustand und enthalten häufig zusätzliche Informationen, die aus Platzgründen nicht enthalten sind.

Zusätzlich zu den Informationen in diesem Repo enthält die Website des Buchs Kapitelzusammenfassungen und zusätzliche Informationen.

Treten Sie der ML4T-Community bei!

Um es den Lesern zu erleichtern, Fragen zum Inhalt des Buches und zu Codebeispielen sowie zur Entwicklung und Umsetzung eigener Strategien und Branchenentwicklungen zu stellen, hosten wir eine Online-Plattform.

Bitte treten Sie unserer Community bei und vernetzen Sie sich mit anderen Händlern, die daran interessiert sind, ML für Handelsstrategien zu nutzen, teilen Sie Ihre Erfahrungen und lernen Sie voneinander!

Was ist neu in der ^2. Edition?

In erster Linie zeigt dieses Buch, wie Sie Signale aus einer Vielzahl von Datenquellen extrahieren und Handelsstrategien für verschiedene Anlageklassen entwerfen können, indem Sie eine breite Palette überwachter, unüberwachter und verstärkender Lernalgorithmen verwenden. Darüber hinaus werden relevante mathematische und statistische Kenntnisse bereitgestellt, um die Optimierung eines Algorithmus oder die Interpretation der Ergebnisse zu erleichtern. Darüber hinaus wird der finanzielle Hintergrund behandelt, der Ihnen bei der Arbeit mit Markt- und Fundamentaldaten, der Extraktion informativer Funktionen und der Verwaltung der Leistung einer Handelsstrategie hilft.

Aus praktischer Sicht zielt die 2. Auflage darauf ab, Sie mit dem konzeptionellen Verständnis und den Werkzeugen auszustatten, um Ihre eigenen ML-basierten Handelsstrategien zu entwickeln. Zu diesem Zweck wird ML als kritisches Element in einem Prozess und nicht als eigenständige Übung betrachtet und der End-to-End-ML für den Handelsworkflow von der Datenbeschaffung, Feature-Engineering und Modelloptimierung bis hin zum Strategiedesign und Backtesting eingeführt.

Genauer gesagt beginnt der ML4T-Workflow mit der Generierung von Ideen für ein klar definiertes Anlageuniversum, dem Sammeln relevanter Daten und dem Extrahieren informativer Merkmale. Dazu gehört auch das Entwerfen, Optimieren und Bewerten von ML-Modellen, die für die Vorhersageaufgabe geeignet sind. Schließlich müssen Handelsstrategien entwickelt werden, um auf die Vorhersagesignale der Modelle zu reagieren, und ihre Leistung anhand historischer Daten mithilfe einer Backtesting-Engine simuliert und bewertet werden. Sobald Sie sich dazu entschließen, eine algorithmische Strategie in einem realen Markt umzusetzen, werden Sie feststellen, dass Sie diesen Arbeitsablauf wiederholt durchlaufen müssen, um neue Informationen und eine sich verändernde Umgebung einzubeziehen.

Der Schwerpunkt der zweiten Ausgabe auf dem ML4t-Workflow führt zu einem neuen Kapitel zum Strategie-Backtesting, einem neuen Anhang, der über 100 verschiedene Alpha-Faktoren beschreibt, und vielen neuen praktischen Anwendungen. Aus Gründen der Klarheit und Lesbarkeit haben wir außerdem die meisten vorhandenen Inhalte neu geschrieben.

Die Handelsanwendungen nutzen nun ein breiteres Spektrum an Datenquellen über die täglichen US-Aktienkurse hinaus, einschließlich internationaler Aktien und ETFs. Außerdem wird gezeigt, wie ML für eine Intraday-Strategie mit minutengenauen Aktiendaten verwendet werden kann. Darüber hinaus erweitert es die Abdeckung alternativer Datenquellen um SEC-Einreichungen für Stimmungsanalysen und Ertragsprognosen sowie Satellitenbilder zur Klassifizierung der Landnutzung.

Eine weitere Neuerung der zweiten Auflage besteht darin, mehrere kürzlich in Top-Fachzeitschriften veröffentlichte Handelsanwendungen nachzubilden:

Kapitel 18 zeigt, wie Faltungs-Neuronale Netze auf Zeitreihen angewendet werden, die in ein Bildformat konvertiert wurden, um Vorhersagen basierend auf Sezer und Ozbahoglu (2018) zu treffen.
Kapitel 20 zeigt, wie Risikofaktoren, die von Aktienmerkmalen abhängig sind, für die Vermögenspreisgestaltung mithilfe von Autoencodern extrahiert werden können, die auf Autoencoder Asset Pricing Models von Shihao Gu, Bryan T. Kelly und Dacheng Xiu (2019) basieren
Kapitel 21 zeigt, wie man synthetische Trainingsdaten mithilfe generativer gegnerischer Netzwerke basierend auf Time-series Generative Adversarial Networks von Jinsung Yoon, Daniel Jarrett und Mihaela van der Schaar (2019) erstellt.

Alle Anwendungen verwenden jetzt die neuesten (zum Zeitpunkt des Schreibens) verfügbaren Softwareversionen wie Pandas 1.0 und TensorFlow 2.2. Es gibt auch eine angepasste Version von Zipline, die es einfach macht, Vorhersagen von maschinellen Lernmodellen in die Entwicklung einer Handelsstrategie einzubeziehen.

Installation, Datenquellen und Fehlerberichte

Die Codebeispiele basieren auf einer breiten Palette von Python-Bibliotheken aus den Bereichen Datenwissenschaft und Finanzen.

Es ist nicht notwendig, alle Bibliotheken auf einmal zu installieren, da dies die Wahrscheinlichkeit von Versionskonflikten erhöht. Stattdessen empfehlen wir Ihnen, die für ein bestimmtes Kapitel erforderlichen Bibliotheken im Laufe der Zeit zu installieren.

Update März 2022: zipline-reloaded , pyfolio-reloaded , alphalens-reloaded und empyrical-reloaded sind jetzt auf dem conda-forge -Kanal verfügbar. Der Kanal ml4t enthält nur veraltete Versionen und wird demnächst entfernt.

Update April 2021: Mit dem Update von Zipline ist die Verwendung von Docker nicht mehr notwendig. Die Installationsanweisungen beziehen sich nun auf betriebssystemspezifische Umgebungsdateien, die Ihnen den Betrieb der Notebooks erleichtern sollen.

Update Februar 2021: Codebeispiel-Release 2.0 aktualisiert die vom Docker-Image bereitgestellten Conda-Umgebungen unter anderem auf Python 3.8, Pandas 1.2 und TensorFlow 1.2; Die Zipline-Backtesting-Umgebung verwendet jetzt Python 3.6.

Das Installationsverzeichnis enthält detaillierte Anweisungen zum Einrichten und Verwenden eines Docker-Images zum Ausführen der Notebooks. Es enthält auch Konfigurationsdateien zum Einrichten verschiedener conda -Umgebungen und zum Installieren der in den Notebooks verwendeten Pakete direkt auf Ihrem Computer, wenn Sie dies bevorzugen (und je nach System bereit sind, die Extrameile zu gehen).
Informationen zum Herunterladen und Vorverarbeiten vieler der in diesem Buch verwendeten Datenquellen finden Sie in den Anweisungen in der README-Datei sowie in verschiedenen Notizbüchern im Datenverzeichnis.

Wenn Sie Schwierigkeiten haben, die Umgebungen zu installieren, die Daten herunterzuladen oder den Code auszuführen, melden Sie bitte ein GitHub-Problem im Repo (hier). Die Arbeit mit GitHub-Problemen wurde hier beschrieben.

Update : Sie können die im Buch verwendeten Algoseek- Daten hier herunterladen. Anweisungen zur Vorverarbeitung finden Sie in Kapitel 2 und ein Intraday-Beispiel mit einem Gradient-Boosting-Modell in Kapitel 12.

Update : Das Abbildungsverzeichnis enthält Farbversionen der im Buch verwendeten Diagramme.

Gliederung und Kapitelzusammenfassung

Das Buch besteht aus vier Teilen, die sich mit unterschiedlichen Herausforderungen befassen, die bei der Beschaffung und Arbeit mit Markt-, Fundamental- und Alternativdatenbeschaffung, der Entwicklung von ML-Lösungen für verschiedene Vorhersageaufgaben im Handelskontext und dem Entwurf und der Bewertung einer Handelsstrategie, die auf von generierten Vorhersagesignalen basiert, auftreten ein ML-Modell.

Das Verzeichnis für jedes Kapitel enthält eine README-Datei mit zusätzlichen Informationen zum Inhalt, Codebeispielen und zusätzlichen Ressourcen.

Teil 1: Von Daten zur Strategieentwicklung

01 Maschinelles Lernen für den Handel: Von der Idee bis zur Ausführung
02 Markt- und Fundamentaldaten: Quellen und Techniken
03 Alternative Daten für das Finanzwesen: Kategorien und Anwendungsfälle
04 Financial Feature Engineering: Wie man Alpha-Faktoren erforscht
05 Portfoliooptimierung und Leistungsbewertung

Teil 2: Maschinelles Lernen für den Handel: Grundlagen

06 Der maschinelle Lernprozess
07 Lineare Modelle: Von Risikofaktoren zu Renditeprognosen
08 Der ML4T-Workflow: Vom Modell zum Strategie-Backtesting
09 Zeitreihenmodelle für Volatilitätsprognosen und statistische Arbitrage
10 Bayesian ML: Dynamische Sharpe Ratios und Paarhandel
11 Random Forests: Eine Long-Short-Strategie für japanische Aktien
12 Steigern Sie Ihre Handelsstrategie
13 Datengesteuerte Risikofaktoren und Asset Allocation mit unüberwachtem Lernen

Teil 3: Verarbeitung natürlicher Sprache für den Handel

14 Textdaten für den Handel: Stimmungsanalyse
15 Themenmodellierung: Finanznachrichten zusammenfassen
16 Worteinbettungen für Earnings Calls und SEC Filings

Teil 4: Deep & Reinforcement Learning

17 Deep Learning für den Handel
18 CNN für Finanzzeitreihen und Satellitenbilder
19 RNN für multivariate Zeitreihen- und Stimmungsanalyse
20 Autoencoder für bedingte Risikofaktoren und Vermögenspreise
21 Generative gegnerische Netze für synthetische Zeitreihendaten
22 Deep Reinforcement Learning: Aufbau eines Handelsagenten
23 Schlussfolgerungen und nächste Schritte
24 Anhang – Alpha-Faktor-Bibliothek

Teil 1: Von Daten zur Strategieentwicklung

Der erste Teil bietet einen Rahmen für die Entwicklung von Handelsstrategien, die auf maschinellem Lernen (ML) basieren. Es konzentriert sich auf die Daten, die den in diesem Buch besprochenen ML-Algorithmen und -Strategien zugrunde liegen, beschreibt, wie für ML-Modelle geeignete Funktionen entwickelt und bewertet werden und wie die Leistung eines Portfolios verwaltet und gemessen wird, während eine Handelsstrategie ausgeführt wird.

01 Maschinelles Lernen für den Handel: Von der Idee bis zur Ausführung

In diesem Kapitel werden Branchentrends untersucht, die zur Entstehung von ML als Quelle von Wettbewerbsvorteilen in der Investmentbranche geführt haben. Wir werden auch untersuchen, wo ML in den Anlageprozess passt, um algorithmische Handelsstrategien zu ermöglichen.

Im Einzelnen werden folgende Themen behandelt:

Wichtige Trends hinter dem Aufstieg von ML in der Investmentbranche
Der Entwurf und die Umsetzung einer Handelsstrategie, die ML nutzt
Beliebte Anwendungsfälle für ML im Handel

02 Markt- und Fundamentaldaten: Quellen und Techniken

Dieses Kapitel zeigt, wie mit Markt- und Fundamentaldaten gearbeitet wird, und beschreibt kritische Aspekte des Umfelds, die sie widerspiegeln. Beispielsweise ist die Kenntnis verschiedener Auftragsarten und der Handelsinfrastruktur nicht nur für die Interpretation der Daten wichtig, sondern auch für die korrekte Gestaltung von Backtest-Simulationen. Wir veranschaulichen auch, wie Sie mit Python auf Handels- und Finanzberichtsdaten zugreifen und diese bearbeiten können.

Praktische Beispiele zeigen, wie man mit Handelsdaten aus NASDAQ-Tick-Daten und Algoseek-Minutenbalkendaten mit einem umfangreichen Satz von Attributen arbeitet, die die Nachfrage-Angebots-Dynamik erfassen, die wir später für eine ML-basierte Intraday-Strategie verwenden werden. Wir befassen uns auch mit verschiedenen Datenanbieter-APIs und der Beschaffung von Finanzberichtsinformationen von der SEC.

In diesem Kapitel geht es insbesondere um Folgendes:

Wie Marktdaten die Struktur des Handelsumfelds widerspiegeln
Arbeiten mit Intraday-Handels- und Kursdaten im Minutentakt
Rekonstruktion des Limit-Orderbuchs aus Tick-Daten mithilfe von NASDAQ ITCH
Zusammenfassung von Tick-Daten mithilfe verschiedener Balkentypen
Arbeiten mit eXtensible Business Reporting Language (XBRL)-kodierten elektronischen Einreichungen
Analyse und Kombination von Markt- und Fundamentaldaten zur Erstellung einer KGV-Reihe
So greifen Sie mit Python auf verschiedene Markt- und Fundamentaldatenquellen zu

03 Alternative Daten für das Finanzwesen: Kategorien und Anwendungsfälle

In diesem Kapitel werden Kategorien und Anwendungsfälle alternativer Daten beschrieben, Kriterien zur Bewertung der explodierenden Zahl von Quellen und Anbietern beschrieben und die aktuelle Marktlandschaft zusammengefasst.

Im dritten Teil des Buchs wird außerdem gezeigt, wie durch Scraping von Websites alternative Datensätze erstellt werden können, beispielsweise durch das Sammeln von Telefonanruftranskripten zur Verwendung mit Natural Language Processing (NLP) und Stimmungsanalysealgorithmen.

Im Einzelnen behandelt dieses Kapitel Folgendes:

Welche neuen Signalquellen sind während der alternativen Datenrevolution entstanden?
Wie Einzelpersonen, Unternehmen und Sensoren vielfältige alternative Daten generieren
Wichtige Kategorien und Anbieter alternativer Daten
Bewertung, wie das wachsende Angebot an alternativen Daten für den Handel genutzt werden kann
Arbeiten mit alternativen Daten in Python, beispielsweise durch Scraping des Internets

04 Financial Feature Engineering: Wie man Alpha-Faktoren erforscht

Wenn Sie bereits mit ML vertraut sind, wissen Sie, dass Feature Engineering eine entscheidende Zutat für erfolgreiche Vorhersagen ist. Mindestens genauso wichtig ist dies im Handelsbereich, wo Forscher aus Wissenschaft und Industrie seit Jahrzehnten untersuchen, was Vermögensmärkte und Preise antreibt und welche Merkmale dabei helfen, Preisbewegungen zu erklären oder vorherzusagen.

In diesem Kapitel werden die wichtigsten Erkenntnisse dieser Forschung als Ausgangspunkt für Ihre eigene Suche nach Alpha-Faktoren dargelegt. Außerdem werden wichtige Werkzeuge zum Berechnen und Testen von Alpha-Faktoren vorgestellt. Dabei wird hervorgehoben, wie die Bibliotheken NumPy, Pandas und TA-Lib die Manipulation von Daten erleichtern, und es werden beliebte Glättungstechniken wie die Wavelets und der Kalman-Filter vorgestellt, die dabei helfen, das Rauschen in Daten zu reduzieren. Nachdem Sie es gelesen haben, wissen Sie Folgendes:

Welche Kategorien von Faktoren gibt es, warum wirken sie und wie werden sie gemessen?
Erstellen von Alpha-Faktoren mit NumPy, Pandas und TA-Lib,
Wie man Daten mithilfe von Wavelets und dem Kalman-Filter entrauscht,
Verwendung von Zipline zum Testen einzelner und mehrerer Alpha-Faktoren,
So verwenden Sie Alphalens zur Bewertung der Vorhersageleistung.

05 Portfoliooptimierung und Leistungsbewertung

Alpha-Faktoren erzeugen Signale, die eine algorithmische Strategie in Trades umsetzt, die wiederum Long- und Short-Positionen erzeugen. Die Rendite und das Risiko des resultierenden Portfolios bestimmen, ob die Strategie den Anlagezielen entspricht.

Es gibt verschiedene Ansätze zur Portfoliooptimierung. Dazu gehört die Anwendung von maschinellem Lernen (ML), um hierarchische Beziehungen zwischen Vermögenswerten zu lernen und sie bei der Gestaltung des Risikoprofils des Portfolios als Ergänzung oder Ersatz zu behandeln. Dieses Kapitel behandelt:

So messen Sie Portfoliorisiko und -rendite
Verwalten von Portfoliogewichten mithilfe der Mittelwert-Varianz-Optimierung und Alternativen
Einsatz von maschinellem Lernen zur Optimierung der Vermögensallokation im Portfoliokontext
Simulieren Sie Trades und erstellen Sie ein Portfolio basierend auf Alpha-Faktoren mit Zipline
So bewerten Sie die Portfolio-Performance mit Pyfolio

Teil 2: Maschinelles Lernen für den Handel: Grundlagen

Der zweite Teil behandelt die grundlegenden überwachten und unüberwachten Lernalgorithmen und veranschaulicht ihre Anwendung auf Handelsstrategien. Außerdem wird die Quantopian-Plattform vorgestellt, die es Ihnen ermöglicht, die in diesem Buch entwickelten Daten und ML-Techniken zu nutzen und zu kombinieren, um algorithmische Strategien zu implementieren, die Trades in Live-Märkten ausführen.

06 Der maschinelle Lernprozess

Dieses Kapitel bildet den Auftakt zu Teil 2, der zeigt, wie Sie eine Reihe überwachter und unüberwachter ML-Modelle für den Handel verwenden können. Wir erläutern die Annahmen und Anwendungsfälle jedes Modells, bevor wir relevante Anwendungen mithilfe verschiedener Python-Bibliotheken demonstrieren.

Es gibt mehrere Aspekte, die viele dieser Modelle und ihre Anwendungen gemeinsam haben. In diesem Kapitel werden diese allgemeinen Aspekte behandelt, sodass wir uns in den folgenden Kapiteln auf die modellspezifische Verwendung konzentrieren können. Es bereitet die Bühne, indem es darlegt, wie die Vorhersageleistung von ML-Modellen als systematischer Arbeitsablauf formuliert, trainiert, abgestimmt und bewertet werden kann. Der Inhalt umfasst:

Wie überwachtes und unüberwachtes Lernen aus Daten funktioniert
Training und Evaluierung überwachter Lernmodelle für Regressions- und Klassifizierungsaufgaben
Wie sich der Kompromiss zwischen Bias und Varianz auf die Vorhersageleistung auswirkt
So diagnostizieren und beheben Sie Vorhersagefehler aufgrund von Überanpassung
Verwendung von Kreuzvalidierung zur Optimierung von Hyperparametern mit Schwerpunkt auf Zeitreihendaten
Warum Finanzdaten beim Testen außerhalb der Stichprobe zusätzliche Aufmerksamkeit erfordern

07 Lineare Modelle: Von Risikofaktoren zu Renditeprognosen

Lineare Modelle sind Standardwerkzeuge für Inferenz und Vorhersage in Regressions- und Klassifizierungskontexten. Zahlreiche weit verbreitete Vermögenspreismodelle basieren auf der linearen Regression. Regularisierte Modelle wie die Ridge- und Lasso-Regression liefern oft bessere Vorhersagen, indem sie das Risiko einer Überanpassung begrenzen. Typische Regressionsanwendungen identifizieren Risikofaktoren, die die Vermögensrenditen beeinflussen, um Risiken zu verwalten oder Renditen vorherzusagen. Zu den Klassifizierungsproblemen gehören hingegen gerichtete Preisprognosen.

Kapitel 07 behandelt die folgenden Themen:

Wie die lineare Regression funktioniert und welche Annahmen sie trifft
Training und Diagnose linearer Regressionsmodelle
Verwendung der linearen Regression zur Vorhersage von Aktienrenditen
Verwenden Sie die Regularisierung, um die Vorhersageleistung zu verbessern
Wie die logistische Regression funktioniert
Konvertieren einer Regression in ein Klassifizierungsproblem

08 Der ML4T-Workflow: Vom Modell zum Strategie-Backtesting

Dieses Kapitel präsentiert eine End-to-End-Perspektive zum Entwerfen, Simulieren und Bewerten einer Handelsstrategie, die von einem ML-Algorithmus gesteuert wird. Wir werden im Detail demonstrieren, wie man eine ML-gesteuerte Strategie in einem historischen Marktkontext mit den Python-Bibliotheken Backtrader und Zipline backtestet. Der ML4T-Workflow zielt letztendlich darauf ab, Beweise aus historischen Daten zu sammeln, die bei der Entscheidung helfen, ob eine Kandidatenstrategie in einem Live-Markt eingesetzt werden soll und finanzielle Ressourcen gefährdet werden. Eine realistische Simulation Ihrer Strategie muss die Funktionsweise der Wertpapiermärkte und die Ausführung von Geschäften getreu wiedergeben. Darüber hinaus müssen mehrere methodische Aspekte beachtet werden, um verzerrte Ergebnisse und falsche Entdeckungen zu vermeiden, die zu schlechten Investitionsentscheidungen führen.

Genauer gesagt werden Sie nach der Durcharbeitung dieses Kapitels in der Lage sein:

Planen und implementieren Sie ein End-to-End-Strategie-Backtesting
Verstehen und vermeiden Sie kritische Fallstricke bei der Implementierung von Backtests
Besprechen Sie die Vor- und Nachteile vektorisierter vs. ereignisgesteuerter Backtesting-Engines
Identifizieren und bewerten Sie die Schlüsselkomponenten eines ereignisgesteuerten Backtesters
Entwerfen und führen Sie den ML4T-Workflow unter Verwendung von Datenquellen in Minuten- und Tagesfrequenzen aus, wobei ML-Modelle separat oder als Teil des Backtests trainiert werden
Nutzen Sie Zipline und Backtrader, um Ihre eigenen Strategien zu entwerfen und zu bewerten

09 Zeitreihenmodelle für Volatilitätsprognosen und statistische Arbitrage

Dieses Kapitel konzentriert sich auf Modelle, die Signale aus dem Verlauf einer Zeitreihe extrahieren, um zukünftige Werte für dieselbe Zeitreihe vorherzusagen. Zeitreihenmodelle sind aufgrund der dem Handel innewohnenden Zeitdimension weit verbreitet. Es stellt Werkzeuge zur Diagnose von Zeitreihenmerkmalen wie Stationarität und zum Extrahieren von Merkmalen vor, die potenziell nützliche Muster erfassen. Außerdem werden univariate und multivariate Zeitreihenmodelle zur Vorhersage von Makrodaten und Volatilitätsmustern eingeführt. Abschließend wird erklärt, wie die Kointegration gemeinsame Trends über Zeitreihen hinweg identifiziert und wie man auf der Grundlage dieses entscheidenden Konzepts eine Paarhandelsstrategie entwickelt.

Es umfasst insbesondere:

Verwendung der Zeitreihenanalyse zur Vorbereitung und Information des Modellierungsprozesses
Schätzung und Diagnose univariater autoregressiver und gleitender Durchschnittsmodelle
Erstellen autoregressiver bedingter Heteroskedastizitätsmodelle (ARCH) zur Vorhersage der Volatilität
So erstellen Sie multivariate vektorautoregressive Modelle
Nutzung der Kointegration zur Entwicklung einer Paarhandelsstrategie

10 Bayesian ML: Dynamische Sharpe Ratios und Paarhandel

Die Bayes'sche Statistik ermöglicht es uns, die Unsicherheit über zukünftige Ereignisse zu quantifizieren und Schätzungen auf prinzipielle Weise zu verfeinern, sobald neue Informationen eintreffen. Dieser dynamische Ansatz passt sich gut an die sich entwickelnde Natur der Finanzmärkte an. Bayesianische ML-Ansätze ermöglichen neue Einblicke in die Unsicherheit im Zusammenhang mit statistischen Metriken, Parameterschätzungen und Vorhersagen. Die Anwendungen reichen von einem detaillierteren Risikomanagement bis hin zu dynamischen Aktualisierungen von Vorhersagemodellen, die Änderungen im Marktumfeld berücksichtigen.

Im Einzelnen behandelt dieses Kapitel Folgendes:

Wie Bayes'sche Statistiken auf maschinelles Lernen angewendet werden
Probabilistische Programmierung mit PyMC3
Definieren und Trainieren von Modellen für maschinelles Lernen mit PyMC3
So führen Sie modernste Stichprobenmethoden aus, um ungefähre Schlussfolgerungen zu ziehen
Bayesianische ML-Anwendungen zur Berechnung dynamischer Sharpe-Verhältnisse, dynamischer Paarhandels-Hedge-Verhältnisse und Schätzung der stochastischen Volatilität

11 Random Forests: Eine Long-Short-Strategie für japanische Aktien

In diesem Kapitel werden Entscheidungsbäume und Zufallswälder auf den Handel angewendet. Entscheidungsbäume lernen Regeln aus Daten, die nichtlineare Eingabe-Ausgabe-Beziehungen kodieren. Wir zeigen, wie man einen Entscheidungsbaum trainiert, um Vorhersagen für Regressions- und Klassifizierungsprobleme zu treffen, die vom Modell erlernten Regeln zu visualisieren und zu interpretieren und die Hyperparameter des Modells zu optimieren, um den Kompromiss zwischen Bias und Varianz zu optimieren und eine Überanpassung zu verhindern.

Im zweiten Teil des Kapitels werden Ensemblemodelle vorgestellt, die mehrere Entscheidungsbäume zufällig kombinieren, um eine einzelne Vorhersage mit einem geringeren Fehler zu erstellen. Den Abschluss bildet eine Long-Short-Strategie für japanische Aktien, die auf Handelssignalen basiert, die von einem Random-Forest-Modell generiert werden.

Kurz gesagt, dieses Kapitel behandelt:

Verwenden Sie Entscheidungsbäume für Regression und Klassifizierung
Gewinnen Sie Erkenntnisse aus Entscheidungsbäumen und visualisieren Sie die aus den Daten gelernten Regeln
Verstehen Sie, warum Ensemble-Modelle tendenziell bessere Ergebnisse liefern
Verwenden Sie Bootstrap-Aggregation, um die Herausforderungen der Überanpassung von Entscheidungsbäumen zu bewältigen
Trainieren, optimieren und interpretieren Sie zufällige Wälder
Nutzen Sie eine Zufallsstruktur, um eine profitable Handelsstrategie zu entwerfen und zu bewerten

12 Steigern Sie Ihre Handelsstrategie

Gradient Boosting ist ein alternativer baumbasierter Ensemble-Algorithmus, der häufig bessere Ergebnisse liefert als zufällige Wälder. Der entscheidende Unterschied besteht darin, dass beim Boosten die Daten, die zum Trainieren jedes Baums verwendet werden, basierend auf den kumulativen Fehlern des Modells geändert werden. Während Random Forests viele Bäume unabhängig voneinander mithilfe zufälliger Teilmengen der Daten trainieren, erfolgt das Boosting sequentiell und gewichtet die Daten neu. In diesem Kapitel wird gezeigt, wie hochmoderne Bibliotheken eine beeindruckende Leistung erzielen und Boosting sowohl auf Tages- als auch auf Hochfrequenzdaten anwenden, um eine Intraday-Handelsstrategie zu testen.

Im Einzelnen werden wir die folgenden Themen behandeln:

Wie unterscheidet sich Boosting vom Bagging und wie hat sich Gradient Boosting aus adaptivem Boosting entwickelt?
Entwerfen und optimieren Sie adaptive und Gradient-Boosting-Modelle mit scikit-learn,
Erstellen, optimieren und bewerten Sie Gradient-Boosting-Modelle für große Datensätze mit den hochmodernen Implementierungen XGBoost, LightGBM und CatBoost.
Interpretation und Gewinnung von Erkenntnissen aus Gradientenverstärkungsmodellen unter Verwendung von SHAP-Werten und
Verwendung von Boosting mit Hochfrequenzdaten zur Entwicklung einer Intraday-Strategie.

13 Datengesteuerte Risikofaktoren und Asset Allocation mit unüberwachtem Lernen

Dimensionsreduktion und Clustering sind die Hauptaufgaben des unbeaufsichtigten Lernens:

Durch die Dimensionsreduktion werden die vorhandenen Features in einen neuen, kleineren Satz umgewandelt und gleichzeitig der Informationsverlust minimiert. Es gibt eine breite Palette von Algorithmen, die sich darin unterscheiden, wie sie den Informationsverlust messen, ob sie lineare oder nichtlineare Transformationen anwenden oder welche Einschränkungen sie dem neuen Funktionsumfang auferlegen.
Clustering-Algorithmen identifizieren und gruppieren ähnliche Beobachtungen oder Merkmale, anstatt neue Merkmale zu identifizieren. Algorithmen unterscheiden sich darin, wie sie die Ähnlichkeit von Beobachtungen und ihre Annahmen über die resultierenden Gruppen definieren.

Im Einzelnen behandelt dieses Kapitel Folgendes:

Wie die Haupt- und unabhängige Komponentenanalyse (PCA und ICA) eine lineare Dimensionsreduktion durchführt
Identifizierung datengesteuerter Risikofaktoren und Eigenportfolios aus Vermögensrenditen mittels PCA
Effektive Visualisierung nichtlinearer, hochdimensionaler Daten durch vielfältiges Lernen
Verwendung von T-SNE und UMAP zur Untersuchung hochdimensionaler Bilddaten
Wie k-Means-, hierarchische und dichtebasierte Clustering-Algorithmen funktionieren
Nutzung von agglomerativem Clustering zum Aufbau robuster Portfolios mit hierarchischer Risikoparität

Teil 3: Verarbeitung natürlicher Sprache für den Handel

Textdaten sind inhaltsreich, aber unstrukturiert im Format und erfordern daher mehr Vorverarbeitung, damit ein Algorithmus für maschinelles Lernen das potenzielle Signal extrahieren kann. Die entscheidende Herausforderung besteht darin, Text in ein numerisches Format zur Verwendung durch einen Algorithmus umzuwandeln und gleichzeitig die Semantik oder Bedeutung des Inhalts auszudrücken.

In den nächsten drei Kapiteln werden mehrere Techniken behandelt, die für Menschen leicht verständliche Sprachnuancen erfassen, sodass maschinelle Lernalgorithmen sie auch interpretieren können.

14 Textdaten für den Handel: Stimmungsanalyse

Textdaten sind sehr inhaltsreich, aber stark unstrukturiert, sodass mehr Vorverarbeitung erforderlich ist, damit ein ML-Algorithmus relevante Informationen extrahieren kann. Eine zentrale Herausforderung besteht darin, Text in ein numerisches Format umzuwandeln, ohne seine Bedeutung zu verlieren. In diesem Kapitel wird gezeigt, wie Dokumente als Vektoren von Token-Zählungen dargestellt werden, indem eine Dokument-Begriffs-Matrix erstellt wird, die wiederum als Eingabe für die Textklassifizierung und Stimmungsanalyse dient. Außerdem wird der Naive-Bayes-Algorithmus vorgestellt und seine Leistung mit linearen und baumbasierten Modellen verglichen.

In diesem Kapitel geht es insbesondere um Folgendes:

Wie der grundlegende NLP-Workflow aussieht
So erstellen Sie eine mehrsprachige Feature-Extraktions-Pipeline mit spaCy und TextBlob
Durchführen von NLP-Aufgaben wie Wortart-Tagging oder Erkennung benannter Entitäten
Konvertieren von Token in Zahlen mithilfe der Dokument-Term-Matrix
Klassifizierung von Nachrichten mithilfe des naiven Bayes-Modells
So führen Sie eine Stimmungsanalyse mit verschiedenen ML-Algorithmen durch

15 Themenmodellierung: Finanznachrichten zusammenfassen

In diesem Kapitel wird unüberwachtes Lernen verwendet, um latente Themen zu modellieren und verborgene Themen aus Dokumenten zu extrahieren. Diese Themen können detaillierte Einblicke in einen großen Korpus von Finanzberichten generieren. Themenmodelle automatisieren die Erstellung anspruchsvoller, interpretierbarer Textfunktionen, die wiederum dabei helfen können, Handelssignale aus umfangreichen Textsammlungen zu extrahieren. Sie beschleunigen die Überprüfung von Dokumenten, ermöglichen die Gruppierung ähnlicher Dokumente und erzeugen Anmerkungen, die für die Vorhersagemodellierung nützlich sind. Zu den Anwendungen gehören die Identifizierung kritischer Themen in Unternehmensoffenlegungen, Gewinnmitteilungsprotokollen oder Verträgen sowie Anmerkungen auf der Grundlage einer Stimmungsanalyse oder der Nutzung von Renditen zugehöriger Vermögenswerte.

Im Einzelnen umfasst es:

Wie sich die Themenmodellierung entwickelt hat, was sie erreicht und warum sie wichtig ist
Reduzierung der Dimensionalität des DTM durch latente semantische Indizierung
Extrahieren von Themen mit probabilistischer latenter semantischer Analyse (pLSA)
Wie die latente Dirichlet-Zuteilung (LDA) pLSA zum beliebtesten Themenmodell macht
Ergebnisse der Themenmodellierung visualisieren und auswerten -
Ausführen von LDA mit scikit-learn und gensim
So wenden Sie die Themenmodellierung auf Sammlungen von Gewinnaufrufen und Finanznachrichtenartikeln an

16 Worteinbettungen für Earnings Calls und SEC Filings

In diesem Kapitel werden neuronale Netze verwendet, um eine Vektordarstellung einzelner semantischer Einheiten wie eines Wortes oder eines Absatzes zu erlernen. Im Vergleich zu den höherdimensionalen spärlichen Vektoren des Bag-of-Words-Modells sind diese Vektoren mit einigen hundert reellen Einträgen dicht. Infolgedessen betten oder lokalisieren diese Vektoren jede semantische Einheit in einem kontinuierlichen Vektorraum.

Einbettungen resultieren aus dem Training eines Modells, um Token mit ihrem Kontext in Beziehung zu setzen, mit dem Vorteil, dass eine ähnliche Verwendung einen ähnlichen Vektor impliziert. Dadurch kodieren sie semantische Aspekte wie Beziehungen zwischen Wörtern anhand ihrer relativen Position. Es handelt sich um leistungsstarke Funktionen, die wir in den folgenden Kapiteln mit Deep-Learning-Modellen verwenden werden.

Genauer gesagt werden wir in diesem Kapitel Folgendes behandeln:

Was Worteinbettungen sind und wie sie semantische Informationen erfassen
So erhalten und verwenden Sie vorab trainierte Wortvektoren
Welche Netzwerkarchitekturen sind beim Training von Word2Vec-Modellen am effektivsten?
So trainieren Sie ein Word2vec-Modell mit TensorFlow und Gensim
Visualisierung und Bewertung der Qualität von Wortvektoren
So trainieren Sie ein word2vec-Modell anhand von SEC-Einreichungen, um Aktienkursbewegungen vorherzusagen
Wie doc2vec word2vec erweitert und bei der Stimmungsanalyse hilft
Warum der Aufmerksamkeitsmechanismus des Transformators einen solchen Einfluss auf NLP hatte
So optimieren Sie vorab trainierte BERT-Modelle anhand von Finanzdaten

Teil 4: Deep & Reinforcement Learning

Teil vier erklärt und demonstriert, wie man Deep Learning für den algorithmischen Handel nutzen kann. Aufgrund der leistungsstarken Fähigkeiten von Deep-Learning-Algorithmen zur Erkennung von Mustern in unstrukturierten Daten eignen sie sich besonders für alternative Daten wie Bilder und Text.

Die Beispielanwendungen zeigen beispielsweise, wie man Text- und Preisdaten kombiniert, um Gewinnüberraschungen aus SEC-Anmeldungen vorherzusagen, synthetische Zeitreihen zu generieren, um die Menge an Trainingsdaten zu erweitern, und wie man einen Handelsagenten mithilfe von Deep Reinforcement Learning schult. Mehrere dieser Anwendungen replizieren Forschungsergebnisse, die kürzlich in führenden Fachzeitschriften veröffentlicht wurden.

17 Deep Learning für den Handel

In diesem Kapitel werden Feedforward-Neuronale Netze (NN) vorgestellt und gezeigt, wie man große Modelle mithilfe von Backpropagation effizient trainiert und gleichzeitig die Risiken einer Überanpassung bewältigt. Außerdem wird gezeigt, wie man TensorFlow 2.0 und PyTorch verwendet und wie man eine NN-Architektur optimiert, um Handelssignale zu generieren. In den folgenden Kapiteln werden wir auf dieser Grundlage aufbauen, um verschiedene Architekturen auf verschiedene Anlageanwendungen anzuwenden, wobei der Schwerpunkt auf alternativen Daten liegt. Dazu gehören wiederkehrende NN, die auf sequentielle Daten wie Zeitreihen oder natürliche Sprache zugeschnitten sind, und Faltungs-NN, die sich besonders gut für Bilddaten eignen. Wir werden uns auch mit tiefgreifendem unbeaufsichtigtem Lernen befassen, beispielsweise mit der Erstellung synthetischer Daten mithilfe von Generative Adversarial Networks (GAN). Darüber hinaus werden wir das verstärkende Lernen diskutieren, um Agenten zu schulen, die interaktiv aus ihrer Umgebung lernen.

In diesem Kapitel wird insbesondere darauf eingegangen

Wie DL KI-Herausforderungen in komplexen Bereichen löst
Schlüsselinnovationen, die DL zu seiner aktuellen Popularität verholfen haben
Wie Feedforward-Netzwerke Darstellungen aus Daten lernen
Entwerfen und Trainieren tiefer neuronaler Netze (NNs) in Python
Implementierung tiefer NNs mit Keras, TensorFlow und PyTorch
Aufbau und Optimierung eines tiefen NN zur Vorhersage von Vermögensrenditen
Entwerfen und Backtesting einer Handelsstrategie basierend auf Deep-NN-Signalen

18 CNN für Finanzzeitreihen und Satellitenbilder

CNN-Architekturen entwickeln sich weiter. In diesem Kapitel werden Bausteine beschrieben, die erfolgreichen Anwendungen gemeinsam sind, es wird gezeigt, wie Transferlernen das Lernen beschleunigen kann und wie CNNs zur Objekterkennung verwendet werden. CNNs können Handelssignale aus Bildern oder Zeitreihendaten generieren. Satellitendaten können Rohstofftrends anhand von Luftbildern von landwirtschaftlichen Gebieten, Minen oder Verkehrsnetzen vorhersagen. Kameraaufnahmen können dabei helfen, Verbraucheraktivitäten vorherzusagen. Wir zeigen, wie man ein CNN aufbaut, das Wirtschaftsaktivitäten in Satellitenbildern klassifiziert. CNNs können auch hochwertige Zeitreihenklassifizierungsergebnisse liefern, indem sie ihre strukturelle Ähnlichkeit mit Bildern ausnutzen, und wir entwerfen eine Strategie, die auf Zeitreihendaten basiert, die wie Bilder formatiert sind.

Im Einzelnen behandelt dieses Kapitel Folgendes:

Wie CNNs mehrere Bausteine verwenden, um gitterähnliche Daten effizient zu modellieren
Training, Tuning und Regularisierung von CNNs für Bilder und Zeitreihendaten mit TensorFlow
Verwenden von Transferlernen zur Straffung von CNNs auch mit weniger Daten
Entwerfen einer Handelsstrategie unter Verwendung von Rückgabebediktionen durch einen CNN, der in Zeitreihen-Daten, die wie Bilder formatiert sind, geschult wurde
So klassifizieren Sie die Wirtschaftstätigkeit basierend auf Satellitenbildern

19 RNN für multivariate Zeitreihen und Stimmungsanalyse

Wiederkehrende neuronale Netzwerke (RNNs) berechnen jede Ausgabe als Funktion der vorherigen Ausgabe und neuen Daten und erstellen effektiv ein Modell mit Speicher, das Parameter über ein tieferes Rechendiagramm aufteilt. Zu den prominenten Architekturen zählen ein langes Kurzzeitgedächtnis (LSTM) und die wiederkehrenden wiederkehrenden Einheiten (GRU), die sich mit den Herausforderungen des Lernens von Abhängigkeiten mit langfristigen Abhängigkeiten befassen. RNNs sind so konzipiert, dass sie eine oder mehrere Eingangssequenzen einer oder mehreren Ausgabesequenzen zugeordnet haben und besonders gut für die natürliche Sprache geeignet sind. Sie können auch auf univariate und multivariate Zeitreihen angewendet werden, um Markt oder grundlegende Daten vorherzusagen. In diesem Kapitel wird behandelt, wie RNN alternative Textdaten unter Verwendung der in Kapitel 16 behandelten Wort -Einbettungen modellieren kann, um das in Dokumenten ausgedrückte Gefühl zu klassifizieren.

Insbesondere in diesem Kapitel befasst sich:

Wie wiederkehrende Verbindungen RNNs ermöglichen, Muster zu merken und einen versteckten Zustand zu modellieren
Ausrollen und Analysieren des Rechendiagramms von RNNs
Wie Gated-Einheiten lernen, den RNN-Speicher aus Daten zu regulieren, um Abhängigkeiten mit Fernbereiche zu ermöglichen
Entwerfen und Training von RNNs für univariate und multivariate Zeitreihen in Python
Wie lernt man Worteinbettungen oder verwenden vorgezogene Wortvektoren für die Stimmungsanalyse mit RNNs
Aufbau eines bidirektionalen RNN zur Vorhersage von Aktienrenditen mit benutzerdefinierten Worteinbettungen

20 Autoencoder für bedingte Risikofaktoren und Preisgestaltung von Anlagen

Dieses Kapitel zeigt, wie man unbeaufsichtigtes Deep -Lernen für den Handel nutzt. Wir diskutieren auch Autoencoder, nämlich ein neuronales Netzwerk, das für die Reproduktion der Eingabe trainiert wird und gleichzeitig eine neue Darstellung lernt, die durch die Parameter einer versteckten Schicht kodiert wird. Autocoder werden seit langem zur Reduzierung der nichtlinearen Dimensionalität verwendet und die NN -Architekturen nutzen, die wir in den letzten drei Kapiteln behandelt haben. Wir replizieren ein aktuelles AQR -Papier, das zeigt, wie AutoCodierer eine Handelsstrategie untermauern können. Wir werden ein tiefes neuronales Netzwerk verwenden, das sich auf einen Autocoder stützt, um Risikofaktoren zu extrahieren und Eigenkapitalrenditen vorherzusagen, die auf einer Reihe von Eigenkapitalattributen bedingt sind.

Insbesondere in diesem Kapitel erfahren Sie über:

Welche Arten von Autoencodern sind praktisch und wie sie funktionieren
Autokodierer für Bau und Schulung mit Python
Verwendung von Autocoder zum Extrahieren von datengesteuerten Risikofaktoren, die die Merkmale von Anlagen berücksichtigen, um die Renditen vorherzusagen

21 generative widersprüchliche Netze für synthetische Zeitreihendaten

In diesem Kapitel werden generative kontroverse Netzwerke (GaN) eingeführt. Gans trainiert einen Generator und ein Diskriminator -Netzwerk in einer Wettbewerbsumgebung, so dass der Generator lernt, Proben zu produzieren, die der Diskriminator nicht von einer bestimmten Klasse von Trainingsdaten unterscheiden kann. Ziel ist es, ein generatives Modell zu ergeben, das synthetische Proben erzeugen kann, die für diese Klasse repräsentativ sind. Während Gans bei Bilddaten am beliebtesten ist, wurden sie auch verwendet, um synthetische Zeitreihendaten im medizinischen Bereich zu generieren. Nachfolgende Experimente mit Finanzdaten untersuchten, ob GANS alternative Preisverläufe erstellen können, die für ML -Schulungs- oder Strategie -Backtests nützlich sind. Wir replizieren das 2019 Neurips Time-Serie Gan Paper, um den Ansatz zu veranschaulichen und die Ergebnisse zu demonstrieren.

Insbesondere in diesem Kapitel erfahren Sie über:

Wie Gans funktionieren, warum sie nützlich sind und wie sie auf den Handel angewendet werden könnten
Gans mit Tensorflow 2 entwerfen und trainieren 2
Generieren von synthetischen Finanzdaten, um die verfügbaren Eingaben für Schulungsmodelle und Backtesting zu erweitern

22 Tiefes Verstärkungslernen: Aufbau eines Handelsagenten

RL (Verstärkung Learning) modelliert das zielgerichtete Lernen eines Agenten, das mit einer stochastischen Umgebung interagiert. RL optimiert die Entscheidungen des Agenten über ein langfristiges Ziel, indem er den Wert von Zuständen und Handlungen aus einem Belohnungssignal lernt. Das ultimative Ziel ist es, eine Richtlinie abzuleiten, die Verhaltensregeln und Kartenzustände für Handlungen codiert. Dieses Kapitel zeigt, wie ein RL -Problem formuliert und gelöst werden kann. Es deckt modellbasierte und modellfreie Methoden ab, führt die OpenAI-Fitnessumgebung ein und kombiniert Deep Learning mit RL, um einen Agenten zu trainieren, der in einer komplexen Umgebung navigiert. Schließlich zeigen wir Ihnen, wie Sie RL an den algorithmischen Handel anpassen, indem wir einen Agenten modellieren, der mit dem Finanzmarkt interagiert und gleichzeitig versucht, eine objektive Funktion zu optimieren.

Insbesondere wird dieses Kapitel behandelt:

Definieren Sie ein Markov -Entscheidungsproblem (MDP)
Verwenden Sie Wert und Richtlinien -Iteration, um einen MDP zu lösen
Wenden Sie das Q-Learning in einer Umgebung mit diskreten Zuständen und Handlungen an
Bauen und trainieren Sie ein tiefes Q-Learning-Agent in einer kontinuierlichen Umgebung
Verwenden Sie das OpenAI -Fitnessstudio, um ein individuelles Marktumfeld zu entwerfen und einen RL -Agenten zum Handel mit Aktien auszubilden

23 Schlussfolgerungen und nächste Schritte

In diesem abschließenden Kapitel werden wir kurz die wesentlichen Werkzeuge, Anwendungen und Lektionen zusammenfassen, die im gesamten Buch gelernt wurden, um zu vermeiden, dass das Gesamtbild nach so vielen Details aus den Augen verloren geht. Wir werden dann Bereiche identifizieren, die wir nicht abgedeckt haben, sich aber darauf konzentrieren, sich zu konzentrieren, wenn Sie die vielen maschinellen Lerntechniken, die wir eingeführt haben, erweitern und in ihrem täglichen Gebrauch produktiv werden.

In diesem Kapitel werden wir in der Summe werden

Überprüfen
Zeigen Sie auf die nächsten Schritte hin, um auf den Techniken in diesem Buch aufzubauen
Schlagen Sie Möglichkeiten vor, ML in Ihren Anlageprozess einzubeziehen

24 Anhang - Alpha -Faktor -Bibliothek

In diesem Buch haben wir betont, wie das intelligente Design von Funktionen, einschließlich geeigneter Vorverarbeitung und Denoising, typischerweise zu einer effektiven Strategie führt. Dieser Anhang synthetisiert einige der im Feature Engineering gelernten Lektionen und liefert zusätzliche Informationen zu diesem wichtigen Thema.

Zu diesem Zweck konzentrieren wir uns auf die breite Palette von Indikatoren, die von TA-LIB (siehe Kapitel 4) und Worldquants 101 formelhaftes Alphas-Papier (Kakushadze 2016) implementiert werden, das quantitative Handelsfaktoren im realen Leben in der Produktion mit einem durchschnittlichen Haltezeitraum aufweist 0,6-6,4 Tage.

Dieses Kapitel umfasst:

So berechnen Sie mehrere Dutzend technische Indikatoren mit Ta-Lib und Numpy/Pandas,
Erstellen der in dem obigen Papier beschriebenen formelhaften Alphas, und
Bewertung der prädiktiven Qualität der Ergebnisse unter Verwendung verschiedener Metriken aus Rangkorrelation und gegenseitigen Informationen, um Wichtigkeit, Shap -Werte und Alphalens zu besitzen.

Expandieren

Zusätzliche Informationen