machine learning for trading Descargar - machine learning for trading Descarga del código fuente

machine learning for trading

Código Fuente de IA

2.0

Descargar

ML para el comercio - ^2.ª edición

Este libro tiene como objetivo mostrar cómo el ML puede agregar valor a las estrategias comerciales algorítmicas de una manera práctica pero integral. Cubre una amplia gama de técnicas de aprendizaje automático, desde la regresión lineal hasta el aprendizaje por refuerzo profundo, y demuestra cómo crear, realizar pruebas retrospectivas y evaluar una estrategia comercial impulsada por predicciones de modelos.

En cuatro partes con 23 capítulos más un apéndice , cubre en más de 800 páginas :

aspectos importantes del abastecimiento de datos, la ingeniería de funciones financieras y la gestión de carteras,
el diseño y evaluación de estrategias a largo y corto plazo basadas en algoritmos de ML supervisados y no supervisados ,
cómo extraer señales negociables de datos de textos financieros , como presentaciones ante la SEC, transcripciones de llamadas de resultados o noticias financieras,
usar modelos de aprendizaje profundo como CNN y RNN con datos alternativos y de mercado, cómo generar datos sintéticos con redes generativas adversarias y capacitar a un agente comercial usando el aprendizaje de refuerzo profundo

Este repositorio contiene más de 150 cuadernos que ponen en práctica los conceptos, algoritmos y casos de uso que se analizan en el libro. Proporcionan numerosos ejemplos que muestran:

cómo trabajar y extraer señales de datos de imágenes y texto fundamentales y alternativos del mercado,
cómo entrenar y ajustar modelos que predicen rendimientos para diferentes clases de activos y horizontes de inversión, incluida cómo replicar investigaciones publicadas recientemente, y
cómo diseñar, realizar pruebas retrospectivas y evaluar estrategias comerciales.

Recomendamos encarecidamente revisar los cuadernos mientras lee el libro; normalmente se encuentran en estado de ejecución y a menudo contienen información adicional que no se incluye debido a limitaciones de espacio.

Además de la información contenida en este repositorio, el sitio web del libro contiene un resumen del capítulo e información adicional.

¡Únase a la comunidad ML4T!

Para que a los lectores les resulte más fácil hacer preguntas sobre el contenido del libro y los ejemplos de código, así como sobre el desarrollo y la implementación de sus propias estrategias y desarrollos de la industria, estamos alojando una plataforma en línea.

Únase a nuestra comunidad y conéctese con otros operadores interesados en aprovechar el aprendizaje automático para estrategias comerciales, comparta su experiencia y aprenda unos de otros.

¿Qué hay de nuevo en la ^2ª edición?

En primer lugar, este libro demuestra cómo se pueden extraer señales de un conjunto diverso de fuentes de datos y diseñar estrategias comerciales para diferentes clases de activos utilizando una amplia gama de algoritmos de aprendizaje supervisados, no supervisados y de refuerzo. También proporciona conocimientos matemáticos y estadísticos relevantes para facilitar el ajuste de un algoritmo o la interpretación de los resultados. Además, cubre los antecedentes financieros que lo ayudarán a trabajar con datos fundamentales y de mercado, extraer características informativas y administrar el desempeño de una estrategia comercial.

Desde un punto de vista práctico, la segunda edición tiene como objetivo equiparlo con la comprensión conceptual y las herramientas para desarrollar sus propias estrategias comerciales basadas en ML. Con este fin, enmarca el ML como un elemento crítico en un proceso en lugar de un ejercicio independiente, presentando el ML de extremo a extremo para el flujo de trabajo comercial desde el abastecimiento de datos, la ingeniería de características y la optimización de modelos hasta el diseño de estrategias y las pruebas retrospectivas.

Más específicamente, el flujo de trabajo ML4T comienza generando ideas para un universo de inversión bien definido, recopilando datos relevantes y extrayendo características informativas. También implica diseñar, ajustar y evaluar modelos de ML adecuados para la tarea predictiva. Finalmente, requiere desarrollar estrategias comerciales para actuar sobre las señales predictivas de los modelos, así como simular y evaluar su desempeño sobre datos históricos utilizando un motor de backtesting. Una vez que decida ejecutar una estrategia algorítmica en un mercado real, se encontrará repitiendo este flujo de trabajo repetidamente para incorporar nueva información y un entorno cambiante.

El énfasis de la segunda edición en el flujo de trabajo de ML4t se traduce en un nuevo capítulo sobre backtesting de estrategias, un nuevo apéndice que describe más de 100 factores alfa diferentes y muchas aplicaciones prácticas nuevas. También hemos reescrito la mayor parte del contenido existente para mayor claridad y legibilidad.

Las aplicaciones comerciales ahora utilizan una gama más amplia de fuentes de datos más allá de los precios diarios de las acciones estadounidenses, incluidas las acciones internacionales y los ETF. También demuestra cómo utilizar ML para una estrategia intradía con datos de acciones de frecuencia minuto. Además, amplía la cobertura de fuentes de datos alternativas para incluir presentaciones de la SEC para análisis de sentimiento y pronósticos de retorno, así como imágenes de satélite para clasificar el uso de la tierra.

Otra innovación de la segunda edición es replicar varias aplicaciones comerciales publicadas recientemente en las principales revistas:

El Capítulo 18 demuestra cómo aplicar redes neuronales convolucionales a series temporales convertidas a formato de imagen para predicciones de retorno basadas en Sezer y Ozbahoglu (2018).
El capítulo 20 muestra cómo extraer factores de riesgo condicionados a las características de las acciones para la fijación de precios de activos utilizando codificadores automáticos basados en los modelos de fijación de precios de activos de Autoencoder de Shihao Gu, Bryan T. Kelly y Dacheng Xiu (2019), y
El capítulo 21 muestra cómo crear datos de entrenamiento sintéticos utilizando redes generativas adversarias basadas en redes generativas adversarias de series temporales de Jinsung Yoon, Daniel Jarrett y Mihaela van der Schaar (2019).

Todas las aplicaciones ahora utilizan las últimas versiones de software disponibles (en el momento de escribir este artículo), como pandas 1.0 y TensorFlow 2.2. También existe una versión personalizada de Zipline que facilita la inclusión de predicciones de modelos de aprendizaje automático al diseñar una estrategia comercial.

Instalación, fuentes de datos e informes de errores.

Los ejemplos de código se basan en una amplia gama de bibliotecas de Python de los dominios de ciencia de datos y finanzas.

No es necesario intentar instalar todas las bibliotecas a la vez porque esto aumenta la probabilidad de encontrar conflictos de versiones. En su lugar, le recomendamos que instale las bibliotecas necesarias para un capítulo específico a medida que avanza.

Actualización de marzo de 2022: zipline-reloaded , pyfolio-reloaded , alphalens-reloaded y empyrical-reloaded ahora están disponibles en el canal conda-forge . El canal ml4t sólo contiene versiones obsoletas y pronto será eliminado.

Actualización abril 2021: con la actualización de Zipline ya no es necesario utilizar Docker. Las instrucciones de instalación ahora hacen referencia a archivos de entorno específicos del sistema operativo que deberían simplificar el funcionamiento de las computadoras portátiles.

Actualización de febrero de 2021: la versión 2.0 de muestra de código actualiza los entornos conda proporcionados por la imagen de Docker a Python 3.8, Pandas 1.2 y TensorFlow 1.2, entre otros; El entorno de backtesting de Zipline ahora utiliza Python 3.6.

El directorio de instalación contiene instrucciones detalladas sobre cómo configurar y usar una imagen de Docker para ejecutar los cuadernos. También contiene archivos de configuración para configurar varios entornos conda e instalar los paquetes utilizados en las computadoras portátiles directamente en su máquina si lo prefiere (y, dependiendo de su sistema, está preparado para hacer un esfuerzo adicional).
Para descargar y preprocesar muchas de las fuentes de datos utilizadas en este libro, consulte las instrucciones en el archivo README junto con varios cuadernos en el directorio de datos.

Si tiene alguna dificultad para instalar los entornos, descargar los datos o ejecutar el código, plantee un problema de GitHub en el repositorio (aquí). Aquí se describe cómo trabajar con problemas de GitHub.

Actualización : puede descargar los datos de algoseek utilizados en el libro aquí. Consulte las instrucciones para el preprocesamiento en el Capítulo 2 y un ejemplo intradiario con un modelo de aumento de gradiente en el Capítulo 12.

Actualización : el directorio de figuras contiene versiones en color de los gráficos utilizados en el libro.

Esquema y resumen del capítulo

El libro consta de cuatro partes que abordan los diferentes desafíos que surgen al obtener y trabajar con fuentes de datos de mercado, fundamentales y alternativos, desarrollar soluciones de aprendizaje automático para diversas tareas predictivas en el contexto comercial y diseñar y evaluar una estrategia comercial que se base en señales predictivas generadas por un modelo de aprendizaje automático.

El directorio de cada capítulo contiene un archivo README con información adicional sobre contenido, ejemplos de código y recursos adicionales.

Parte 1: De los datos al desarrollo de estrategias

01 Aprendizaje automático para el trading: de la idea a la ejecución
02 Datos fundamentales y de mercado: fuentes y técnicas
03 Datos alternativos para finanzas: categorías y casos de uso
04 Ingeniería de funciones financieras: cómo investigar factores alfa
05 Optimización de cartera y evaluación del desempeño

Parte 2: Aprendizaje automático para el comercio: fundamentos

06 El proceso de aprendizaje automático
07 Modelos lineales: de los factores de riesgo a las previsiones de rentabilidad
08 El flujo de trabajo ML4T: del modelo al backtesting de la estrategia
09 Modelos de series temporales para pronósticos de volatilidad y arbitraje estadístico
10 ML bayesiano: ratios dinámicos de Sharpe y comercio de pares
11 bosques aleatorios: una estrategia a largo y corto plazo para las acciones japonesas
12 Impulsando su estrategia comercial
13 factores de riesgo basados en datos y asignación de activos con aprendizaje no supervisado

Parte 3: Procesamiento del lenguaje natural para el comercio

14 Datos de texto para operar: análisis de sentimiento
15 Modelado de temas: resumen de noticias financieras
16 incrustaciones de palabras para llamadas de ganancias y presentaciones ante la SEC

Parte 4: Aprendizaje profundo y de refuerzo

17 Aprendizaje profundo para el comercio
18 CNN para series de tiempo financieras e imágenes de satélite
19 RNN para series temporales multivariadas y análisis de sentimiento
20 codificadores automáticos para factores de riesgo condicionales y fijación de precios de activos
21 redes generativas de confrontación para datos de series temporales sintéticas
22 Aprendizaje por refuerzo profundo: creación de un agente comercial
23 Conclusiones y próximos pasos
24 Apéndice: Biblioteca de factores alfa

Parte 1: De los datos al desarrollo de estrategias

La primera parte proporciona un marco para desarrollar estrategias comerciales impulsadas por el aprendizaje automático (ML). Se centra en los datos que impulsan los algoritmos y estrategias de ML discutidos en este libro, describe cómo diseñar y evaluar características adecuadas para los modelos de ML y cómo administrar y medir el desempeño de una cartera mientras se ejecuta una estrategia comercial.

01 Aprendizaje automático para el trading: de la idea a la ejecución

Este capítulo explora las tendencias de la industria que han llevado al surgimiento del ML como fuente de ventaja competitiva en la industria de inversiones. También veremos dónde encaja el ML en el proceso de inversión para permitir estrategias comerciales algorítmicas.

Más específicamente, cubre los siguientes temas:

Tendencias clave detrás del aumento del ML en la industria de inversiones
El diseño y ejecución de una estrategia comercial que aprovecha el ML.
Casos de uso populares de ML en el comercio

02 Datos fundamentales y de mercado: fuentes y técnicas

Este capítulo muestra cómo trabajar con datos fundamentales y de mercado y describe los aspectos críticos del entorno que reflejan. Por ejemplo, la familiaridad con varios tipos de órdenes y la infraestructura comercial es importante no sólo para la interpretación de los datos sino también para diseñar correctamente las simulaciones de backtest. También ilustramos cómo utilizar Python para acceder y manipular datos comerciales y de estados financieros.

Los ejemplos prácticos demuestran cómo trabajar con datos comerciales de datos de ticks de NASDAQ y datos de barras de minutos de Algoseek con un rico conjunto de atributos que capturan la dinámica de oferta y demanda que luego usaremos para una estrategia intradiaria basada en ML. También cubrimos varias API de proveedores de datos y cómo obtener información de estados financieros de la SEC.

En particular, este capítulo cubre:

Cómo los datos del mercado reflejan la estructura del entorno comercial
Trabajar con datos de cotizaciones y comercio intradiario con frecuencia de minutos
Reconstrucción del libro de órdenes límite a partir de datos de ticks utilizando NASDAQ ITCH
Resumir datos de ticks utilizando varios tipos de barras
Trabajar con presentaciones electrónicas codificadas en eXtensible Business Reporting Language (XBRL)
Analizar y combinar datos fundamentales y de mercado para crear una serie P/E
Cómo acceder a diversas fuentes de datos fundamentales y de mercado utilizando Python

03 Datos alternativos para finanzas: categorías y casos de uso

Este capítulo describe categorías y casos de uso de datos alternativos, describe criterios para evaluar el creciente número de fuentes y proveedores y resume el panorama actual del mercado.

También demuestra cómo crear conjuntos de datos alternativos mediante el scraping de sitios web, como la recopilación de transcripciones de llamadas de ganancias para usarlas con procesamiento de lenguaje natural (NLP) y algoritmos de análisis de sentimientos en la tercera parte del libro.

Más específicamente, este capítulo cubre:

¿Qué nuevas fuentes de señales han surgido durante la revolución de los datos alternativos?
Cómo los individuos, las empresas y los sensores generan un conjunto diverso de datos alternativos
Categorías importantes y proveedores de datos alternativos
Evaluar cómo se puede utilizar la creciente oferta de datos alternativos para el comercio
Trabajar con datos alternativos en Python, como raspar Internet

04 Ingeniería de funciones financieras: cómo investigar factores alfa

Si ya está familiarizado con el aprendizaje automático, sabrá que la ingeniería de funciones es un ingrediente crucial para realizar predicciones exitosas. Importa al menos tanto en el ámbito comercial, donde investigadores académicos y de la industria han investigado durante décadas qué impulsa los mercados y los precios de activos, y qué características ayudan a explicar o predecir los movimientos de precios.

Este capítulo describe las conclusiones clave de esta investigación como punto de partida para su propia búsqueda de factores alfa. También presenta herramientas esenciales para calcular y probar factores alfa, destacando cómo las bibliotecas NumPy, pandas y TA-Lib facilitan la manipulación de datos y presentan técnicas de suavizado populares como las wavelets y el filtro de Kalman que ayudan a reducir el ruido en los datos. Después de leerlo, sabrás sobre:

Qué categorías de factores existen, por qué funcionan y cómo medirlos.
Creando factores alfa usando NumPy, pandas y TA-Lib,
Cómo eliminar el ruido de los datos utilizando wavelets y el filtro de Kalman
Usando Zipline para probar factores alfa individuales y múltiples,
Cómo utilizar Alphalens para evaluar el rendimiento predictivo.

05 Optimización de cartera y evaluación del desempeño

Los factores alfa generan señales que una estrategia algorítmica traduce en operaciones que, a su vez, producen posiciones largas y cortas. Los rendimientos y el riesgo de la cartera resultante determinan si la estrategia cumple con los objetivos de inversión.

Existen varios enfoques para optimizar las carteras. Estos incluyen la aplicación de aprendizaje automático (ML) para aprender relaciones jerárquicas entre activos y tratarlos como complementos o sustitutos al diseñar el perfil de riesgo de la cartera. Este capítulo cubre:

Cómo medir el riesgo y el rendimiento de la cartera
Gestión de ponderaciones de cartera mediante optimización de varianza media y alternativas.
Uso del aprendizaje automático para optimizar la asignación de activos en el contexto de una cartera
Simular operaciones y crear una cartera basada en factores alfa usando Zipline
Cómo evaluar el rendimiento de la cartera usando pyfolio

Parte 2: Aprendizaje automático para el comercio: fundamentos

La segunda parte cubre los algoritmos fundamentales de aprendizaje supervisados y no supervisados e ilustra su aplicación a las estrategias comerciales. También presenta la plataforma Quantopian que le permite aprovechar y combinar los datos y las técnicas de ML desarrolladas en este libro para implementar estrategias algorítmicas que ejecuten operaciones en mercados reales.

06 El proceso de aprendizaje automático

Este capítulo inicia la Parte 2 que ilustra cómo se puede utilizar una variedad de modelos de ML supervisados y no supervisados para el comercio. Explicaremos los supuestos y los casos de uso de cada modelo antes de demostrar aplicaciones relevantes utilizando varias bibliotecas de Python.

Hay varios aspectos que tienen en común muchos de estos modelos y sus aplicaciones. Este capítulo cubre estos aspectos comunes para que podamos centrarnos en el uso específico del modelo en los siguientes capítulos. Prepara el escenario al describir cómo formular, entrenar, ajustar y evaluar el rendimiento predictivo de los modelos de ML como un flujo de trabajo sistemático. El contenido incluye:

Cómo funciona el aprendizaje supervisado y no supervisado a partir de datos
Entrenamiento y evaluación de modelos de aprendizaje supervisado para tareas de regresión y clasificación.
Cómo la compensación sesgo-varianza afecta el rendimiento predictivo
Cómo diagnosticar y abordar los errores de predicción debidos al sobreajuste
Uso de validación cruzada para optimizar hiperparámetros centrándose en datos de series de tiempo
Por qué los datos financieros requieren atención adicional al realizar pruebas fuera de la muestra

07 Modelos lineales: de los factores de riesgo a las previsiones de rentabilidad

Los modelos lineales son herramientas estándar para inferencia y predicción en contextos de regresión y clasificación. Numerosos modelos de valoración de activos ampliamente utilizados se basan en la regresión lineal. Los modelos regularizados como la regresión Ridge y Lasso a menudo producen mejores predicciones al limitar el riesgo de sobreajuste. Las aplicaciones de regresión típicas identifican factores de riesgo que impulsan la rentabilidad de los activos para gestionar riesgos o predecir rentabilidades. Los problemas de clasificación, por otro lado, incluyen pronósticos direccionales de precios.

El Capítulo 07 cubre los siguientes temas:

Cómo funciona la regresión lineal y qué supuestos hace
Entrenamiento y diagnóstico de modelos de regresión lineal.
Uso de la regresión lineal para predecir la rentabilidad de las acciones
Utilice la regularización para mejorar el rendimiento predictivo.
Cómo funciona la regresión logística
Convertir una regresión en un problema de clasificación

08 El flujo de trabajo ML4T: del modelo al backtesting de la estrategia

Este capítulo presenta una perspectiva integral sobre el diseño, la simulación y la evaluación de una estrategia comercial impulsada por un algoritmo ML. Demostraremos en detalle cómo realizar una prueba retrospectiva de una estrategia impulsada por ML en un contexto histórico de mercado utilizando las bibliotecas de Python backtrader y Zipline. En última instancia, el flujo de trabajo ML4T tiene como objetivo recopilar evidencia de datos históricos que ayuden a decidir si implementar una estrategia candidata en un mercado real y poner en riesgo los recursos financieros. Una simulación realista de su estrategia debe representar fielmente cómo operan los mercados de valores y cómo se ejecutan las operaciones. Además, varios aspectos metodológicos requieren atención para evitar resultados sesgados y descubrimientos falsos que conduzcan a malas decisiones de inversión.

Más específicamente, después de trabajar en este capítulo podrá:

Planificar e implementar backtesting de estrategias de extremo a extremo
Comprender y evitar errores críticos al implementar backtests
Analice las ventajas y desventajas de los motores de backtesting vectorizados frente a los basados en eventos.
Identificar y evaluar los componentes clave de un backtester basado en eventos.
Diseñe y ejecute el flujo de trabajo de ML4T utilizando fuentes de datos en frecuencias diarias y por minuto, con modelos de ML entrenados por separado o como parte del backtest.
Utilice Zipline y backtrader para diseñar y evaluar sus propias estrategias

09 Modelos de series temporales para pronósticos de volatilidad y arbitraje estadístico

Este capítulo se centra en modelos que extraen señales del historial de una serie temporal para predecir valores futuros para la misma serie temporal. Los modelos de series temporales se utilizan ampliamente debido a la dimensión temporal inherente al comercio. Presenta herramientas para diagnosticar características de series temporales, como la estacionariedad, y extraer características que capturen patrones potencialmente útiles. También introduce modelos de series de tiempo univariados y multivariados para pronosticar datos macro y patrones de volatilidad. Finalmente, explica cómo la cointegración identifica tendencias comunes a lo largo de series temporales y muestra cómo desarrollar una estrategia de negociación de pares basada en este concepto crucial.

En particular, cubre:

Cómo utilizar el análisis de series de tiempo para preparar e informar el proceso de modelado
Estimación y diagnóstico de modelos univariados autorregresivos y de media móvil
Construcción de modelos autorregresivos de heterocedasticidad condicional (ARCH) para predecir la volatilidad
Cómo construir modelos vectoriales autorregresivos multivariados
Uso de la cointegración para desarrollar una estrategia de negociación de pares

10 ML bayesiano: ratios dinámicos de Sharpe y comercio de pares

Las estadísticas bayesianas nos permiten cuantificar la incertidumbre sobre eventos futuros y refinar las estimaciones según principios a medida que llega nueva información. Este enfoque dinámico se adapta bien a la naturaleza cambiante de los mercados financieros. Los enfoques bayesianos del aprendizaje automático permiten obtener nuevos conocimientos sobre la incertidumbre en torno a las métricas estadísticas, las estimaciones de parámetros y las predicciones. Las aplicaciones van desde una gestión de riesgos más granular hasta actualizaciones dinámicas de modelos predictivos que incorporan cambios en el entorno del mercado.

Más específicamente, este capítulo cubre:

Cómo se aplican las estadísticas bayesianas al aprendizaje automático
Programación probabilística con PyMC3
Definición y entrenamiento de modelos de aprendizaje automático utilizando PyMC3.
Cómo ejecutar métodos de muestreo de última generación para realizar inferencias aproximadas
Aplicaciones bayesianas de aprendizaje automático para calcular índices dinámicos de Sharpe, índices de cobertura de comercio de pares dinámicos y estimar la volatilidad estocástica

11 bosques aleatorios: una estrategia a largo y corto plazo para las acciones japonesas

Este capítulo aplica árboles de decisión y bosques aleatorios al comercio. Los árboles de decisión aprenden reglas a partir de datos que codifican relaciones no lineales de entrada-salida. Mostramos cómo entrenar un árbol de decisiones para hacer predicciones para problemas de regresión y clasificación, visualizar e interpretar las reglas aprendidas por el modelo y ajustar los hiperparámetros del modelo para optimizar el equilibrio entre sesgo y varianza y evitar el sobreajuste.

La segunda parte del capítulo presenta modelos de conjunto que combinan múltiples árboles de decisión de forma aleatoria para producir una única predicción con un error menor. Concluye con una estrategia larga y corta para acciones japonesas basada en señales comerciales generadas por un modelo de bosque aleatorio.

En resumen, este capítulo cubre:

Utilice árboles de decisión para regresión y clasificación.
Obtenga información a partir de árboles de decisión y visualice las reglas aprendidas a partir de los datos.
Comprenda por qué los modelos de conjunto tienden a ofrecer resultados superiores
Utilice la agregación bootstrap para abordar los desafíos de sobreajuste de los árboles de decisión
Entrena, sintoniza e interpreta bosques aleatorios
Emplear un bosque aleatorio para diseñar y evaluar una estrategia comercial rentable

12 Impulsando su estrategia comercial

El aumento de gradiente es un algoritmo de conjunto alternativo basado en árboles que a menudo produce mejores resultados que los bosques aleatorios. La diferencia fundamental es que el impulso modifica los datos utilizados para entrenar cada árbol en función de los errores acumulativos cometidos por el modelo. Mientras que los bosques aleatorios entrenan muchos árboles de forma independiente utilizando subconjuntos aleatorios de datos, el impulso procede de forma secuencial y repondera los datos. Este capítulo muestra cómo las bibliotecas de última generación logran un rendimiento impresionante y aplican mejoras a los datos diarios y de alta frecuencia para realizar pruebas retrospectivas de una estrategia de negociación intradiaria.

Más específicamente, cubriremos los siguientes temas:

¿En qué se diferencia el impulso del embolsado y cómo evolucionó el impulso de gradiente a partir del impulso adaptativo?
Diseñe y ajuste modelos adaptativos y de aumento de gradiente con scikit-learn,
Cree, optimice y evalúe modelos de aumento de gradiente en grandes conjuntos de datos con las implementaciones de última generación XGBoost, LightGBM y CatBoost.
Interpretar y obtener información de los modelos de aumento de gradiente utilizando valores SHAP, y
Utilizar el impulso con datos de alta frecuencia para diseñar una estrategia intradía.

13 factores de riesgo basados en datos y asignación de activos con aprendizaje no supervisado

La reducción de dimensionalidad y la agrupación son las principales tareas del aprendizaje no supervisado:

La reducción de dimensionalidad transforma las características existentes en un conjunto nuevo y más pequeño al tiempo que minimiza la pérdida de información. Existe una amplia gama de algoritmos que se diferencian por cómo miden la pérdida de información, ya sea que apliquen transformaciones lineales o no lineales o las restricciones que imponen al nuevo conjunto de características.
Los algoritmos de agrupamiento identifican y agrupan observaciones o características similares en lugar de identificar características nuevas. Los algoritmos difieren en cómo definen la similitud de las observaciones y sus suposiciones sobre los grupos resultantes.

Más específicamente, este capítulo cubre:

Cómo el análisis de componentes principales e independientes (PCA e ICA) realiza la reducción de dimensionalidad lineal
Identificación de factores de riesgo basados en datos y carteras propias a partir de rendimientos de activos mediante PCA
Visualización efectiva de datos no lineales y de alta dimensión mediante aprendizaje múltiple
Uso de T-SNE y UMAP para explorar datos de imágenes de alta dimensión
Cómo funcionan los algoritmos de agrupamiento k-medias, jerárquicos y basados en densidad
Uso de agrupaciones aglomerativas para crear carteras sólidas con paridad de riesgo jerárquica

Parte 3: Procesamiento del lenguaje natural para el comercio

Los datos de texto son ricos en contenido, pero su formato no está estructurado y, por lo tanto, requieren más preprocesamiento para que un algoritmo de aprendizaje automático pueda extraer la señal potencial. El desafío crítico consiste en convertir el texto a un formato numérico para que lo utilice un algoritmo, al mismo tiempo que se expresa la semántica o el significado del contenido.

Los siguientes tres capítulos cubren varias técnicas que capturan matices del lenguaje fácilmente comprensibles para los humanos, de modo que los algoritmos de aprendizaje automático también puedan interpretarlos.

14 Datos de texto para operar: análisis de sentimiento

Los datos de texto son muy ricos en contenido pero muy desestructurados, por lo que requieren más procesamiento previo para permitir que un algoritmo ML extraiga información relevante. Un desafío clave consiste en convertir el texto a un formato numérico sin perder su significado. Este capítulo muestra cómo representar documentos como vectores de recuentos de tokens mediante la creación de una matriz de términos de documento que, a su vez, sirve como entrada para la clasificación de texto y el análisis de opiniones. También presenta el algoritmo Naive Bayes y compara su rendimiento con modelos lineales y basados en árboles.

En particular, en este capítulo se cubre:

Cómo se ve el flujo de trabajo fundamental de la PNL
Cómo crear un canal de extracción de funciones multilingüe utilizando spaCy y TextBlob
Realizar tareas de PNL como etiquetado de partes del discurso o reconocimiento de entidades nombradas
Conversión de tokens a números usando la matriz de términos de documento
Clasificación de noticias utilizando el ingenuo modelo de Bayes.
Cómo realizar análisis de sentimiento utilizando diferentes algoritmos de ML

15 Modelado de temas: resumen de noticias financieras

Este capítulo utiliza el aprendizaje no supervisado para modelar temas latentes y extraer temas ocultos de documentos. Estos temas pueden generar información detallada sobre un gran corpus de informes financieros. Los modelos de temas automatizan la creación de características de texto sofisticadas e interpretables que, a su vez, pueden ayudar a extraer señales comerciales de extensas colecciones de textos. Aceleran la revisión de documentos, permiten agrupar documentos similares y producen anotaciones útiles para el modelado predictivo. Las aplicaciones incluyen la identificación de temas críticos en divulgaciones de la empresa, transcripciones o contratos de llamadas de ganancias y anotaciones basadas en análisis de sentimiento o utilizando retornos de activos relacionados.

Más específicamente, cubre:

Cómo ha evolucionado el modelado temático, qué logra y por qué es importante
Reducir la dimensionalidad del DTM mediante indexación semántica latente
Extracción de temas con análisis semántico latente probabilístico (pLSA)
Cómo la asignación latente de Dirichlet (LDA) mejora pLSA para convertirse en el modelo temático más popular
Visualizar y evaluar los resultados del modelado de temas -
Ejecutando LDA usando scikit-learn y gensim
Cómo aplicar modelos de temas a colecciones de llamadas sobre resultados y artículos de noticias financieras

16 incrustaciones de palabras para llamadas de ganancias y presentaciones ante la SEC

Este capítulo utiliza redes neuronales para aprender una representación vectorial de unidades semánticas individuales como una palabra o un párrafo. Estos vectores son densos con unos pocos cientos de entradas de valor real, en comparación con los vectores dispersos de dimensiones superiores del modelo de bolsa de palabras. Como resultado, estos vectores incrustan o ubican cada unidad semántica en un espacio vectorial continuo.

Las incrustaciones resultan del entrenamiento de un modelo para relacionar tokens con su contexto con el beneficio de que un uso similar implica un vector similar. Como resultado, codifican aspectos semánticos como las relaciones entre palabras a través de su ubicación relativa. Son características poderosas que usaremos con modelos de aprendizaje profundo en los siguientes capítulos.

Más específicamente, en este capítulo cubriremos:

Qué son las incrustaciones de palabras y cómo capturan información semántica
Cómo obtener y utilizar vectores de palabras previamente entrenados
¿Qué arquitecturas de red son más efectivas para entrenar modelos word2vec?
Cómo entrenar un modelo word2vec usando TensorFlow y gensim
Visualizar y evaluar la calidad de los vectores de palabras.
Cómo entrenar un modelo word2vec en presentaciones ante la SEC para predecir los movimientos del precio de las acciones
Cómo doc2vec amplía word2vec y ayuda con el análisis de sentimientos
Por qué el mecanismo de atención del transformador tuvo tal impacto en la PNL
Cómo ajustar los modelos BERT previamente entrenados en datos financieros

Parte 4: Aprendizaje profundo y de refuerzo

La cuarta parte explica y demuestra cómo aprovechar el aprendizaje profundo para el comercio algorítmico. Las poderosas capacidades de los algoritmos de aprendizaje profundo para identificar patrones en datos no estructurados los hacen particularmente adecuados para datos alternativos como imágenes y texto.

Las aplicaciones de muestra muestran, por ejemplo, cómo combinar texto y datos de precios para predecir sorpresas en las ganancias de las presentaciones ante la SEC, generar series temporales sintéticas para ampliar la cantidad de datos de capacitación y capacitar a un agente comercial mediante el aprendizaje por refuerzo profundo. Varias de estas aplicaciones replican investigaciones publicadas recientemente en las principales revistas.

17 Aprendizaje profundo para el comercio

Este capítulo presenta las redes neuronales de avance (NN) y demuestra cómo entrenar de manera eficiente modelos grandes utilizando la propagación hacia atrás mientras se gestionan los riesgos del sobreajuste. También muestra cómo utilizar TensorFlow 2.0 y PyTorch y cómo optimizar una arquitectura NN para generar señales comerciales. En los siguientes capítulos, aprovecharemos esta base para aplicar varias arquitecturas a diferentes aplicaciones de inversión con un enfoque en datos alternativos. Estos incluyen NN recurrente adaptado a datos secuenciales como series temporales o lenguaje natural y NN convolucional, particularmente adecuado para datos de imágenes. También cubriremos el aprendizaje profundo no supervisado, como cómo crear datos sintéticos utilizando Generative Adversarial Networks (GAN). Además, discutiremos el aprendizaje por refuerzo para capacitar agentes que aprendan interactivamente de su entorno.

En particular, este capítulo cubrirá

Cómo DL resuelve los desafíos de la IA en dominios complejos
Innovaciones clave que han impulsado a DL a su popularidad actual
Cómo las redes feedforward aprenden representaciones a partir de datos
Diseño y entrenamiento de redes neuronales profundas (NN) en Python
Implementación de NN profundas usando Keras, TensorFlow y PyTorch
Creación y ajuste de una NN profunda para predecir la rentabilidad de los activos
Diseño y backtesting de una estrategia comercial basada en señales NN profundas

18 CNN para series de tiempo financieras e imágenes de satélite

Las arquitecturas de CNN continúan evolucionando. Este capítulo describe los componentes básicos comunes a las aplicaciones exitosas, demuestra cómo el aprendizaje por transferencia puede acelerar el aprendizaje y cómo usar CNN para la detección de objetos. Las CNN pueden generar señales comerciales a partir de imágenes o datos de series temporales. Los datos satelitales pueden anticipar las tendencias de los productos básicos a través de imágenes aéreas de áreas agrícolas, minas o redes de transporte. Las imágenes de la cámara pueden ayudar a predecir la actividad del consumidor; Mostramos cómo construir una CNN que clasifique la actividad económica en imágenes de satélite. Las CNN también pueden ofrecer resultados de clasificación de series temporales de alta calidad aprovechando su similitud estructural con las imágenes, y diseñamos una estrategia basada en datos de series temporales formateados como imágenes.

Más específicamente, este capítulo cubre:

Cómo los CNN emplean varios bloques de construcción para modelar eficientemente datos similares a la red
Capacitación, ajuste y regularización de CNN para imágenes y datos de series temporales utilizando TensorFlow
Uso del aprendizaje de transferencia para optimizar CNNS, incluso con menos datos
Diseño de una estrategia comercial utilizando predicciones de retorno por un CNN capacitado en datos de serie horario formateadas como imágenes
Cómo clasificar la actividad económica basada en imágenes satelitales

19 RNN para series de tiempo multivariadas y análisis de sentimientos

Las redes neuronales recurrentes (RNN) calculan cada salida en función de la salida anterior y los nuevos datos, creando efectivamente un modelo con memoria que comparte parámetros en un gráfico computacional más profundo. Las arquitecturas prominentes incluyen memoria a largo plazo (LSTM) y unidades recurrentes cerradas (Gru) que abordan los desafíos de aprender dependencias de largo alcance. Los RNN están diseñados para asignar una o más secuencias de entrada a una o más secuencias de salida y son particularmente adecuados para el lenguaje natural. También se pueden aplicar a series de tiempo univariadas y multivariadas para predecir datos de mercado o fundamentales. Este capítulo cubre cómo RNN puede modelar datos de texto alternativos utilizando la palabra incrustaciones que cubrimos en el Capítulo 16 para clasificar el sentimiento expresado en los documentos.

Más específicamente, este capítulo aborda:

Cómo las conexiones recurrentes permiten que los RNN memoricen los patrones y modelen un estado oculto
Desenrollar y analizar el gráfico computacional de RNNS
Cómo las unidades cerradas aprenden a regular la memoria RNN de los datos para habilitar dependencias de largo alcance
Diseño y capacitación de RNN para series temporales univariadas y multivariadas en Python
Cómo aprender incrustaciones de palabras o usar vectores de palabras previos a la aparición para el análisis de sentimientos con RNNS
Construyendo un RNN bidireccional para predecir los rendimientos de las acciones utilizando incrustaciones de palabras personalizadas

20 autoencoders para factores de riesgo condicionales y precios de activos

Este capítulo muestra cómo aprovechar el aprendizaje profundo no supervisado para el comercio. También discutimos Autoencoders, a saber, una red neuronal entrenada para reproducir la entrada mientras aprende una nueva representación codificada por los parámetros de una capa oculta. Los autoencoders se han utilizado durante mucho tiempo para la reducción de la dimensionalidad no lineal, aprovechando las arquitecturas NN que cubrimos en los últimos tres capítulos. Replicamos un artículo reciente de AQR que muestra cómo los autoencoders pueden apuntalar una estrategia comercial. Utilizaremos una red neuronal profunda que se basa en un autoencoder para extraer factores de riesgo y predecir los rendimientos de capital, condicionado en una variedad de atributos de capital.

Más específicamente, en este capítulo aprenderá sobre:

Qué tipos de autoencoders son de uso práctico y cómo funcionan
Construyendo y entrenando autoencoders que usan Python
Uso de autoencoders para extraer factores de riesgo basados en datos que tienen en cuenta las características de los activos para predecir los retornos

21 redes adversas generativas para datos de series temporales sintéticas

Este capítulo presenta redes adversas generativas (GaN). GANS capacita a un generador y una red de discriminadores en un entorno competitivo para que el generador aprenda a producir muestras que el discriminador no puede distinguir de una clase dada de datos de capacitación. El objetivo es producir un modelo generativo capaz de producir muestras sintéticas representativas de esta clase. Si bien más popular entre los datos de imágenes, los GAN también se han utilizado para generar datos de series de tiempo sintéticas en el dominio médico. Experimentos posteriores con datos financieros exploraron si los GAN pueden producir trayectorias de precios alternativas útiles para capacitación de ML o compras de estrategia. Replicamos el papel GaN de series de tiempo Neurips 2019 para ilustrar el enfoque y demostrar los resultados.

Más específicamente, en este capítulo aprenderá sobre:

Cómo funcionan los Gans, por qué son útiles y cómo podrían aplicarse al comercio
Diseño y capacitación Gans utilizando TensorFlow 2
Generación de datos financieros sintéticos para expandir las entradas disponibles para capacitar modelos ML y retroceso

22 Aprendizaje de refuerzo profundo: construir un agente comercial

El aprendizaje de refuerzo (RL) modela el aprendizaje dirigido por objetivos por un agente que interactúa con un entorno estocástico. RL optimiza las decisiones del agente con respecto a un objetivo a largo plazo al aprender el valor de los estados y las acciones de una señal de recompensa. El objetivo final es derivar una política que codifique las reglas de comportamiento y mapea a los estados a las acciones. Este capítulo muestra cómo formular y resolver un problema RL. Cubre métodos basados en modelos y sin modelos, introduce el entorno de gimnasio Operai y combina el aprendizaje profundo con RL para entrenar a un agente que navega por un entorno complejo. Finalmente, le mostraremos cómo adaptar RL al comercio algorítmico modelando a un agente que interactúa con el mercado financiero mientras intenta optimizar una función objetivo.

Más específicamente, este capítulo cubrirá:

Defina un problema de decisión de Markov (MDP)
Use el valor y la iteración de la política para resolver un MDP
Aplicar Q-learning en un entorno con estados y acciones discretas
Construir y entrenar a un agente profundo de Q-learning en un entorno continuo
Use el gimnasio Operai para diseñar un entorno de mercado personalizado y capacitar a un agente de RL para intercambiar acciones

23 conclusiones y próximos pasos

En este capítulo final, resumiremos brevemente las herramientas, aplicaciones y lecciones esenciales aprendidas en todo el libro para evitar perder de vista el panorama general después de tantos detalles. Luego identificaremos áreas en las que no cubrimos, pero que valdría la pena centrarnos a medida que se amplíe en las muchas técnicas de aprendizaje automático que presentamos y se vuelve productivo en su uso diario.

En resumen, en este capítulo,

Revise los conclusiones clave y las lecciones aprendidas
Señale los próximos pasos para construir sobre las técnicas de este libro
Sugerir formas de incorporar ML en su proceso de inversión

24 Apéndice - Biblioteca Alpha Factor

A lo largo de este libro, enfatizamos cómo el diseño inteligente de las características, incluido el preprocesamiento y la renovación apropiados, generalmente conduce a una estrategia efectiva. Este apéndice sintetiza algunas de las lecciones aprendidas sobre la ingeniería de funciones y proporciona información adicional sobre este tema vital.

Con este fin, nos centramos en la amplia gama de indicadores implementados por TA-LIB (ver Capítulo 4) y el documento de Alphas Formulaic 101 de Worldquant (Kakushadze 2016), que presenta factores de comercio cuantitativos de la vida real utilizados en la producción con un período de tenencia promedio de la tenencia de la tenencia de la tenencia de 0.6-6.4 días.

Este capítulo cubre:

Cómo calcular varias docenas de indicadores técnicos utilizando TA-LIB y Numpy/Pandas,
Creación de los alfas formulados describe en el artículo anterior, y
Evaluar la calidad predictiva de los resultados utilizando varias métricas a partir de la correlación de rango y la información mutua para presentar importancia, valores de forma y alfalenses.

Expandir

Información adicional