intelligent trading botダウンロード - intelligent trading botソースコードのダウンロード

intelligent trading bot

AI ソースコード

1.0.0

ダウンロード

 ___       _       _ _ _                  _     _____              _ _               ____        _ 
|_ _|_ __ | |_ ___| | (_) __ _  ___ _ __ | |_  |_   _| __ __ _  __| (_)_ __   __ _  | __ )  ___ | |_
 | || '_ | __/ _  | | |/ _` |/ _  '_ | __|   | || '__/ _` |/ _` | | '_  / _` | |  _  / _ | __|
 | || | | | ||  __/ | | | (_| |  __/ | | | |_    | || | | (_| | (_| | | | | | (_| | | |_) | (_) | |_ 
|___|_| |_|_____|_|_|_|__, |___|_| |_|__|   |_||_|  __,_|__,_|_|_| |_|__, | |____/ ___/ __|
                         |___/                                               |___/                   
₿   Ξ   ₳   ₮   ✕   ◎   ●   Ð   Ł   Ƀ   Ⱥ   ∞   ξ   ◈   ꜩ   ɱ   ε   ɨ   Ɓ   Μ   Đ  ⓩ  Ο   Ӿ   Ɍ  ȿ

?インテリジェントな取引シグナル? https://t.me/intelligent_trading_signals

インテリジェントな取引ボット

このプロジェクトは、最先端の機械学習 (ML) アルゴリズムと特徴量エンジニアリングを使用して、自動取引暗号通貨用のインテリジェント取引ボットを開発することを目的としています。このプロジェクトは、次の主要な機能を提供します。

テクニカル指標を含むカスタム (Python) 関数を使用した派生特徴の定義
バッチオフラインモードで履歴データを分析し、機械学習モデルをトレーニングする
予測スコアを分析し、最適な信号パラメーターを選択する
シグナリングサービスは、取引所に定期的に新しいデータを要求し、オンラインモードで事前にトレーニングされたモデルを適用することによって売買シグナルを生成します。
生成されたシグナルに従って資産を売買する実際の取引を行う取引サービス

インテリジェントな取引チャネル

シグナリングサービスはクラウドで実行されており、そのシグナルを次の Telegram チャネルに送信します。

?インテリジェントな取引シグナル? https://t.me/intelligent_trading_signals

誰でもチャンネルに登録して、このボットが生成するシグナルについての印象を得ることができます。

現在、ボットは次のパラメーターを使用して構成されています。

取引所：バイナンス
暗号通貨: ₿ ビットコイン
分析頻度: 1 分 (現時点では唯一のオプション)
-1 から +1 までのスコア。 <0 は減少する可能性が高いことを意味し、>0 は増加する可能性が高いことを意味します
フィルター: スコアが ±0.20 より大きい場合にのみ通知が送信されます (変更される可能性があります)
0.05 ステップごとに 1 つの増加/減少符号が追加されます (フィルターのしきい値を超える)

スコアがしきい値を下回り、チャネルに通知が送信されないサイレント期間が存在します。スコアがしきい値より大きい場合は、次のような通知が 1 分ごとに送信されます。

₿ 24.518 ???スコア: -0.26

最初の数字は最新の終値です。スコア -0.26 は、価格が現在の終値よりも安くなる可能性が非常に高いことを意味します。

スコアがモデルで指定されたしきい値を超えた場合、売買シグナルが生成され、取引を行うのに良い時期であることを意味します。このような通知は次のようになります。

?購入: ₿ 24,033 スコア: +0.34

機械学習モデルのトレーニング (オフライン)

バッチデータ処理パイプライン

Signaler サービスが機能するには、多数の ML モデルがトレーニングされ、サービスで使用できるモデルファイルが必要です。すべてのスクリプトは、いくつかの入力データをロードし、いくつかの出力ファイルを保存することにより、バッチモードで実行されます。バッチスクリプトはscriptsモジュールにあります。

すべてが設定されている場合は、次のスクリプトを実行する必要があります。

python -m scripts.download_binance -c config.json
python -m scripts.merge -c config.json
python -m scripts.features -c config.json
python -m scripts.labels -c config.json
python -m scripts.train -c config.json
python -m scripts.signals -c config.json
python -m scripts.train_signals -c config.json

構成ファイルがないと、スクリプトはデフォルトのパラメータを使用します。これはテスト目的に役立ちますが、良好なパフォーマンスを示すことを目的としたものではありません。 config-sample-v0.6.0.jsoncなど、リリースごとに提供されるサンプル構成ファイルを使用します。

ソースデータのダウンロードと結合

両方のスクリプトの主な構成パラメータは、 data_sources内のソースのリストです。このリストの 1 つのエントリは、データソースと、異なるソースからの同じ名前の列を区別するために使用されるcolumn_prefix指定します。

最新の履歴データをダウンロードします: python -m scripts.download_binance -c config.json
- Binance API を使用しますが、他のデータソースを使用したり、他のスクリプトを使用してデータを手動でダウンロードしたりすることもできます。
複数の履歴データセットを 1 つのデータセットにマージします: python -m scripts.merge -c config.json
- このスクリプトは 2 つの問題を解決します: 1) 深度データや先物などの他のソースが存在する可能性がある 2) データソースにギャップがある可能性があるため、出力ファイルに通常の時間ラスターを生成する必要がある

フィーチャの生成

このスクリプトは、派生機能を計算することを目的としています。

スクリプト: python -m scripts.features -c config.json
現在、利用可能なすべての入力レコード (最新の更新だけでなく) の機能を計算することにより、非増分モデルで実行されているため、複雑な構成には数時間かかる場合があります。
スクリプトはマージされた入力データをロードし、フィーチャ生成プロシージャを適用して、すべての派生フィーチャを出力ファイルに保存します。
生成されたすべての特徴がトレーニングと予測に使用されるわけではありません。トレーニング/予測フェーズでは、別個の機能リストが指定されます。
機能関数は、設定セクションから Windows などの追加パラメータを取得します。
オンラインフィーチャ生成 (マイクロバッチ用に生成される場合はサービス内) とオフラインフィーチャ生成には、同じフィーチャを使用する必要があります。

生成される機能のリストは、構成ファイル内のfeature_setsリストを介して構成されます。フィーチャがどのように生成されるかは、config セクションで指定されたいくつかのパラメータを持つフィーチャジェネレータによって定義されます。

talib特徴ジェネレーターは、TA-lib 技術分析ライブラリに依存しています。以下はその構成の例です"config": {"columns": ["close"], "functions": ["SMA"], "windows": [5, 10, 15]}
itbstats特徴ジェネレーターは、 scipy_skew 、 scipy_kurtosis 、 lsbm (平均値を下回る最長ストライク)、 fmax (最大値の最初の位置)、 mean 、 std 、 area 、 slopeなどの tsfresh にある関数を実装します。一般的なパラメータは次のとおりです: "config": {"columns": ["close"], "functions": ["skew", "fmax"], "windows": [5, 10, 15]}
itblib特徴ジェネレーターは ITB に実装されていますが、その機能のほとんどは talib 経由で (はるかに高速に) 生成できます。
tsfresh tsfresh ライブラリから関数を生成します

ラベルを生成する

このスクリプトは、入力ファイルに新しい列を追加するため、フィーチャ生成に似ています。ただし、これらの列は、予測したいことと、オンラインモードで実行するときに不明なことを説明します。たとえば、将来の価格上昇が考えられます。

スクリプト: python -m scripts.labels -c config.json
スクリプトはフィーチャをロードし、ラベル列を計算し、結果を出力ファイルに保存します。
生成されたすべてのラベルを使用する必要はありません。トレーニングに使用されるラベルは別のリストで指定されます

生成されるラベルのリストは、構成内のlabel_setsリストを介して構成されます。 1 つのラベルセットは、追加の列を生成する関数を指します。それらの構成は機能の構成と非常に似ています。

highlowラベルジェネレーターは、価格が将来の期間内に指定されたしきい値よりも高い場合に True を返します。
highlow2それ以前に大きな減少（増加）がないことを条件として、将来の増加（減少）を計算します。その典型的な構成は次のとおりです"config": {"columns": ["close", "high", "low"], "function": "high", "thresholds": [1.0, 1.5, 2.0], "tolerance": 0.2, "horizon": 10080, "names": ["first_high_10", "first_high_15", "first_high_20"]}
topbot非推奨になりました
topbot2最大値と最小値を計算します (True としてラベル付けされます)。ラベル付きのすべての最大値 (最小値) は、指定されたレベルよりも低い (高い) 最小値 (最大値) に囲まれることが保証されます。隣接する最小値と最大値の間の必要な最小差は、 levelパラメーターによって指定されます。許容値パラメーターを使用すると、最大/最小に近い点も含めることができます。一般的な構成は次のとおりです"config": {"columns": "close", "function": "bot", "level": 0.02, "tolerances": [0.1, 0.2], "names": ["bot2_1", "bot2_2"]}

予測モデルをトレーニングする

このスクリプトは、指定された入力特徴とラベルを使用して、いくつかの ML モデルをトレーニングします。

スクリプト: python -m scripts.train -c config.json
ハイパーパラメータ調整はこの手順の一部ではありません - それらは既知であるはずです
アルゴリズムの説明とハイパーパラメーターはモデルストアで指定されます。
結果は複数のモデルファイルとしてモデルフォルダーに保存されます。ファイル名は予測された列名と等しく、次のパターンになります: (label_name、algorithm_name)
このスクリプトは、指定されたすべてのラベルとすべての指定されたアルゴリズムに対してモデルをトレーニングします。
このスクリプトは、すべてのモデルの予測スコアを含むprediction-metrics.txtファイルも生成します。

構成：

モデルとハイパーパラメータはmodel_store.pyに記述されています
トレーニングに使用する特徴はtrain_featuresで指定します
ラベルのリストはlabelsで指定します
アルゴリズムのリストはalgorithmsで指定されます

集計と後処理

このステップの目的は、さまざまなラベルに対してさまざまなアルゴリズムによって生成された予測スコアを集計することです。結果は 1 つのスコアとなり、次のステップの信号ルールによって消費されることになります。集計パラメータは、 score_aggregationセクションで指定します。 buy_labelsとsell_labels集計手順によって処理される入力予測スコアを指定します。 windowローリング集計に使用される前のステップの数であり、 combine 2 つのスコアタイプ (購入とラベル) を 1 つの出力スコアに結合する方法です。

信号の生成

集計手順によって生成されるスコアは何らかの数値であり、シグナルルールの目的は、売買の決定 (買うか売るか何もしない) を行うことです。シグナルルールのパラメータはtrade_modelに記述されます。

列車信号モデル

このスクリプトは、多くの売買シグナルパラメーターを使用して取引をシミュレートし、最もパフォーマンスの高いシグナルパラメーターを選択します。

スクリプト: python -m scripts.train_signals -c config.json

トレーニング済みモデルに基づくオンライン予測 (サービス)

このスクリプトは、最新のデータの読み込み、特徴の生成、予測の実行、シグナルの生成、サブスクライバーへの通知という同じタスクを定期的に実行するサービスを開始します。

スクリプトを開始します: python -m service.server -c config.json
このサービスは、モデルが構成で指定された機能を使用してトレーニングされたことを前提としています。
サービスは、構成で指定されている資格情報を使用して交換にアクセスします。

ハイパーパラメータチューニング

次の 2 つの問題があります。

ML モデルに最適なハイパーパラメーターを選択する方法。この問題は、グリッド検索などの古典的な方法で解決されます。たとえば、勾配ブースティングの場合、異なるハイパーパラメーターを使用して同じデータでモデルをトレーニングし、最良のスコアを示すパラメーターを選択します。このアプローチには 1 つの欠点があります。それは、パフォーマンスをトレードするのではなく、最高のスコアを目指して最適化することです。これは、取引パフォーマンスが良好であることが保証されていないことを意味します（実際には良好ではないでしょう）。したがって、後の段階で取引パフォーマンスを最適化することを目的として、このスコアを中間機能として使用します。
最終的な集計スコア (+0.21 など) を計算する場合、問題は、買うべきか、売るべきか、それとも何もしないべきかということです。実際、それは最も難しい質問です。これに答えるために、売買シグナル生成のバックテストと最適化を行うための追加のスクリプトが開発されました。
- モデルを定期的に再トレーニングし、それらを予測に使用することで、実行内容をシミュレートするローリング予測を生成します: python -m scripts.predict_rolling -c config.json
- 履歴データで最高のパフォーマンスを生み出す売り買いシグナルの最適なしきい値を選択するためにシグナルモデルをトレーニングします: python -m scripts.train_signals -c config.json

設定パラメータ

構成パラメータは、次の 2 つのファイルで指定されます。

Appクラスのconfigフィールドのservice.App.py
-c config.jsom引数。このファイルがスクリプトまたはサービスに読み込まれると、この構成ファイルの値がApp.config内の値を上書きします。

以下に最も重要なフィールドをいくつか示します ( App.pyとconfig.jsonの両方)。

data_folder - バッチオフラインスクリプトにのみ必要なデータファイルの場所
symbolはBTCUSDTのような取引ペアです
アナライザーのパラメーター。これらは主に列名です。
- ラベルラベルとして扱われる列名のlabels 。トレーニングと予測に使用する新しいラベルを定義する場合は、ここでその名前を指定する必要があります
- algorithmsトレーニングに使用されるアルゴリズム名のリスト
- train_featuresトレーニングと予測の入力特徴として使用されるすべての列名のリスト。
署名者:
- buy_labelsおよびsell_labelsシグナルに使用される予測列のリスト
- trade_modelシグナラーのパラメーター (主にいくつかのしきい値)
traderトレーダーパラメータのセクションです。現時点では完全にテストされていません。
collectorこれらのパラメーターセクションは、データ収集サービスを目的としています。データ収集サービスには、データプロバイダーへの定期的なリクエストと同期するサービスと、データプロバイダーに登録して新しいデータが利用可能になるとすぐに通知を受け取る非同期ストリーミングサービスの 2 種類があります。これらは動作していますが、十分にテストされておらず、メインサービスに統合されていません。現在の主な使用パターンは、手動のバッチデータ更新、特徴生成、モデルトレーニングに依存しています。これらのデータ収集サービスを使用する理由の 1 つは、1) 更新を高速化するため、2) オーダーブックなどの通常の API では利用できないデータを取得するためです (このデータを使用する機能がいくつかありますが、それらはメインのワークフローには統合されていません)。

詳細については、App.config のサンプル構成ファイルとコメントを参照してください。

信号サービス

シグナラーは 1 分ごとに次の手順を実行して、価格が上昇する可能性があるか下落する可能性があるかを予測します。

サーバーから最新のデータを取得し、履歴を含む現在のデータウィンドウを更新します (履歴の長さは構成パラメーターによって定義されます)。
収集された最も近い履歴 (最新のデータが含まれる) に基づいて派生特徴を計算します。計算される特徴は構成ファイルに記述されており、モデルのトレーニング中にバッチモードで使用されるものとまったく同じです。
いくつかの (以前にトレーニングされた) ML モデルを、(より複雑な) 派生特徴としても扱われるいくつかの将来の値 (必ずしも価格ではない) を予測することによって適用します。いくつかの予測モデル (現在は、勾配ブースティング、ニューラルネットワーク、線形回帰) をいくつかのターゲット変数 (ラベル) に適用します。
さまざまな ML モデルによって生成された予測結果を集約し、上昇または下降トレンドの強さを反映する最終的なシグナルスコアを計算します。ここでは、以前に計算された多くのスコアを入力として使用し、1 つの出力スコアを導き出します。現在、これは集計手順として実装されていますが、以前に収集されたスコアとターゲット変数に基づいてトレーニングされた専用の ML モデルに基づく可能性があります。正のスコアは成長を意味し、負のスコアは低下を意味します
最終スコアを通知に使用する

注:

シグナラーの最終結果はスコア (-1 ～ +1) です。スコアは、他のパラメータやデータソースを考慮して、売買に関するさらなる決定に使用する必要があります。
Signaler サービスが機能するには、トレーニングされたモデルが利用可能であり、「MODELS」フォルダーに保存されている必要があります。モデルはバッチモードでトレーニングされ、そのプロセスについては対応するセクションで説明します。

サービスの開始: python3 -m service.server -c config.json