hands on llmsダウンロード - hands on llmsソースコードのダウンロード

hands on llms

その他のソースコード

1.0.0

ダウンロード

実践的な LLM コース

リアルタイム財務アドバイザーのトレーニングと配置方法を学ぶ

Paul Iusztin、Pau Labarta Bajo、Alexandru Razvant著

1. ビルディングブロック
- 1.1.トレーニングパイプライン
- 1.2.ストリーミングリアルタイムパイプライン
- 1.3.推論パイプライン
- 1.4.財務 Q&A データセット
2. 外部サービスのセットアップ
- 2.1.アルパカ
- 2.2.クドラント
- 2.3. ML彗星
- 2.4.ビーム
- 2.5. AWS
3. インストールと使用方法
4. 講義
- 4.1.コスト
- 4.2.質問する
- 4.3.ビデオ講義
- 4.4.記事
5. ライセンス
6. 寄稿者と教師

1. ビルディングブロック

3 パイプライン設計を使用して、このコースで構築する方法を学習します↓

1.1.トレーニングパイプライン

次のようなトレーニングパイプライン:

独自の Q&A データセットをロードします
QLoRA を使用してオープンソース LLM を微調整する
Comet ML の実験トラッカーにトレーニング実験を記録し、Comet ML の LLMOps ダッシュボードに推論結果を記録します。
Comet ML のモデルレジストリに最適なモデルを保存します

トレーニングパイプラインは、サーバーレス GPU インフラストラクチャとして Beam を使用してデプロイされます。

-> modules/training_pipelineディレクトリの下にあります。

最小ハードウェア要件

CPU: 4コア
RAM: 14 GiB
VRAM: 10 GiB (必須の CUDA 対応 Nvidia GPU)

注:最小ハードウェア要件を満たしていない場合でも、心配する必要はありません。トレーニングパイプラインを Beam のサーバーレスインフラストラクチャにデプロイし、そこで LLM をトレーニングする方法を示します。

1.2.ストリーミングリアルタイムパイプライン

次のようなリアルタイム機能パイプライン:

Alpaca から金融ニュースを取り込みます
Bytewax を使用してニュース文書をリアルタイムでクリーンアップし、埋め込みに変換します
埋め込みを Qdrant Vector DB に保存します

ストリーミングパイプラインは、GitHub アクションに組み込まれた CI/CD パイプラインを使用して、AWS EC2 マシンに自動的にデプロイされます。

-> modules/streaming_pipelineディレクトリの下にあります。

最小ハードウェア要件

CPU：1コア
RAM: 2 GiB
VRAM: -

1.3.推論パイプライン

LangChain を使用して次のようなチェーンを作成する推論パイプライン。

Comet のモデルレジストリから微調整されたモデルをダウンロードします
ユーザーの質問を入力として受け取ります
Qdrant Vector DB にクエリを実行し、関連する金融ニュースのプロンプトを強化します
最初のクエリ、ベクター DB からのコンテキスト、チャット履歴を使用して、財務上のアドバイスを得るために微調整された LLM を呼び出します。
チャット履歴をメモリに永続化します
プロンプトと回答を Comet ML の LLMOps モニタリング機能に記録します

推論パイプラインは、サーバーレス GPU インフラストラクチャとしての Beam を RESTful API として使用してデプロイされます。また、デモ用に UI の下にラップされており、Gradio で実装されています。

-> modules/financial_botディレクトリの下にあります。

最小ハードウェア要件

CPU: 4コア
RAM: 14 GiB
VRAM: 8 GiB (必須の CUDA 対応 Nvidia GPU)

注:最小ハードウェア要件を満たしていない場合でも、心配する必要はありません。推論パイプラインを Beam のサーバーレスインフラストラクチャにデプロイし、そこから LLM を呼び出す方法を示します。

1.4.財務 Q&A データセット

GPT3.5使用して財務 Q&A データセットを生成し、財務条件の使用と財務に関する質問への回答に特化するようにオープンソース LLM を微調整しました。 GPT3.5などの大きな LLM を使用して、より小さな LLM (Falcon 7B など) をトレーニングするデータセットを生成することは、蒸留による微調整として知られています。

→ 財務 Q&A データセットをどのように生成したかを理解するには、Pau Labarta が書いたこの記事を参照してください。

→ 財務 Q&A データセットの完全な分析を確認するには、Alexandru Razvant が作成したコースの dataset_analysis サブセクションを確認してください。

2. 外部サービスのセットアップ

モジュールに入る前に、コース用に追加の外部ツールをいくつかセットアップする必要があります。

注:必要なものはすべてのモジュールで示されるため、モジュールごとに設定できます。

2.1.アルパカ

financial news data source

このドキュメントに従って、無料アカウントを作成し、このコース内で必要な API キーを生成する方法を説明します。

注: Alpaca データ接続 1 回は無料です。

2.2.クドラント

serverless vector DB

Qdrant にアクセスして、無料アカウントを作成します。

その後、このドキュメントに従って、このコース内で必要となる API キーを生成する方法を説明します。

注: Qdrant のフリーミアムプランのみを使用します。

2.3. ML彗星

serverless ML platform

Comet ML にアクセスして、無料アカウントを作成します。

その後、このガイドに従って、コース内で必要となる API KEY と新しいプロジェクトを生成します。

注: Comet ML のフリーミアムプランのみを使用します。

2.4.ビーム

serverless GPU compute | training & inference pipelines

Beam に移動し、無料アカウントを作成します。

その後、インストールガイドに従って CLI をインストールし、Beam 資格情報を使用して構成する必要があります。

Beam について詳しくは、こちらの入門ガイドをご覧ください。

注:無料のコンピューティング時間は最大 10 時間です。その後は、使用した分だけお支払いいただきます。 Nvidia GPU > 8 GB VRAM を使用していて、トレーニングおよび推論パイプラインをデプロイしたくない場合、Beam の使用はオプションです。

トラブルシューティング

Poetry を使用する場合、Poetry 仮想環境内で Beam CLI を見つけるのに問題がありました。これを修正するには、Beam をインストールした後、次のように Poetry のバイナリを指すシンボリックリンクを作成します。

 export COURSE_MODULE_PATH= < your-course-module-path > # e.g., modules/training_pipeline
 cd $COURSE_MODULE_PATH
 export POETRY_ENV_PATH= $( dirname $( dirname $( poetry run which python ) ) )

 ln -s /usr/local/bin/beam ${POETRY_ENV_PATH} /bin/beam

2.5. AWS

cloud compute | feature pipeline

AWS に移動し、アカウントを作成し、認証情報のペアを生成します。

その後、AWS CLI v2.11.22 をダウンロードしてインストールし、認証情報を使用して設定します。

注:使用した分だけお支払いいただきます。 t2.small EC2 VM のみをデプロイします。これは、1 時間あたりわずか~$0.023です。機能パイプラインをデプロイしたくない場合、AWS の使用はオプションです。

3. インストールと使用方法

すべてのモジュールには依存関係とスクリプトがあります。本番環境の設定では、すべてのモジュールにリポジトリがありますが、この使用例では、学習目的ですべてを 1 か所にまとめています。

したがって、各モジュールの README を個別に調べて、インストール方法と使用方法を確認してください。

q_and_a_dataset_generator
トレーニング_パイプライン
ストリーミング_パイプライン
推論_パイプライン

4. 講義

このコースを最大限に活用するために、このリポジトリを複製し、これまでに行ったことをすべて複製することを強くお勧めします。

各モジュールのビデオ講義、記事、および README ドキュメントには、段階的な手順が記載されています。

楽しく学習しましょう！

4.1.コスト

GitHub コード (MIT ライセンスに基づいてリリース) とビデオ講義 (YouTube でリリース) は完全に無料です。常にそうなります。

Medium のレッスンは、Medium の有料ウォールの下でリリースされます。すでにお持ちの場合は無料です。それ以外の場合は、記事を読むために月額 5 ドルを支払う必要があります。

4.2.質問する

コース中に質問や問題がある場合は、必要なことをすべて詳しく説明できるこのリポジトリに問題を作成することをお勧めします。

それ以外の場合は、LinkedIn で教師に連絡することもできます。

ポール・イウスティン
パウ・ラバルタ

4.3.ビデオ講義

4.3.1.コースの紹介

ビデオを見るにはここをクリックしてください?

4.3.2.オープンソース LLM の微調整 (概要)

ビデオを見るにはここをクリックしてください?

4.3.3.オープンソース LLM の微調整 (実践!)

ビデオを見るにはここをクリックしてください?

4.3.4.リアルタイムテキスト埋め込みパイプライン

ビデオを見るにはここをクリックしてください?

4.3.5.推論パイプライン

ビデオを見るにはここをクリックしてください?

4.4.記事

To understand the entire code step-by-step, check out our articles ↓

システム設計

レッスン 1: LLM キット: ストリーミングパイプライン、RAG、および LLMOps を使用して、本番環境に対応したリアルタイムファイナンシャルアドバイザーシステムを構築する

機能パイプライン

レッスン 2: LLM アプリケーションで RAG を実行するときにバッチパイプラインを介したストリーミングを選択する必要がある理由
レッスン 3: ストリーミングパイプラインを構築およびデプロイして、リアルタイム RAG 用のベクター DB を設定する方法です。

トレーニングパイプライン

レッスン 4: LLM 微調整キットに含める必要がある 5 つの概念
レッスン 5: QLoRA を使用して LLM を微調整するための汎用コードを作成する秘訣
レッスン 6: LLM 開発から LLMOps を使用した継続的なトレーニングパイプラインまで

推論パイプライン

レッスン 7: 3 パイプラインアーキテクチャを活用した RAG LangChain アプリケーションの設計
レッスン 8: RAG LangChain アプリケーションを実稼働用に準備する

5. ライセンス

このコースは、MIT ライセンスに基づいてリリースされたオープンソースプロジェクトです。したがって、ライセンスを配布し、私たちの成果を認めている限り、このプロジェクトを安全にクローンまたはフォークして、必要なもの (大学のプロジェクト、大学の学位プロジェクトなど) のインスピレーションの源として使用できます。

6. 寄稿者と教師

	パウ・ラバルタ・バジョ \|シニア ML および MLOps エンジニア主な先生。ビデオレッスンの人。リンクトインツイッター/X ユーチューブ現実世界の ML ニュースレター現実世界の ML サイト
	アレクサンドル・ラズヴァント \|シニア ML エンジニア二代目シェフ。舞台裏のエンジニア。リンクトインニューラリープ
	ポール・イウスティン \|シニア ML および MLOps エンジニアメインシェフ。ビデオレッスンにランダムに現れる男たち。リンクトインツイッター/X ML ニュースレターのデコード個人サイト \| ML および MLOps ハブ