このリポジトリには、Llama-2 などの大規模言語モデル (LLM) におけるデータの鮮度の問題に対処するために設計された技術である検索拡張生成 (RAG) に関連するコードとリソースが含まれています。 LLM は、最近の出来事や最新情報を認識していないことがよくあります。 RAG は、知識ベースからの外部知識を LLM 応答に組み込み、正確で根拠のある応答を可能にします。
src
: RAG 手法を実装するためのソース コードとナレッジ ベースとの対話が含まれます。data
: ナレッジ ベースを構築するためのデータセットと関連リソースを保存します。db
: ナレッジ ベース検索用のトークン埋め込みまたはベクトル表現を管理および保存します。requirements.txt
: このリポジトリ内のコードを実行するために必要な Python パッケージ。 RAG は、大規模言語モデル (LLM) 機能と外部知識ベースを組み合わせて、生成される応答の品質と鮮度を向上させる新しいアプローチです。外部ソースから文脈的に関連する知識を取得し、それを LLM で生成されたコンテンツに組み込むことで、古い情報という課題に対処します。
Gradio は、機械学習モデルの UI を迅速に作成するのに役立つ Python ライブラリです。これにより、大規模なフロントエンド開発を行わなくても、モデルを迅速にデプロイし、ユーザーフレンドリーなインターフェイスを通じてモデルにアクセスできるようになります。
gradio_chatbot.py
コードが実行されると、Gradio アプリが起動します。これには、埋め込みモデル、生成モデル、編集可能なシステム プロンプト、選択した LLM の調整可能なパラメーターなどの変更可能な要素が含まれています。
このリポジトリのコードを使用するには、次の手順に従います。
リポジトリのクローンをローカル マシンに作成します。
コマンドラインを使用してリポジトリ ディレクトリに移動します。
次のコマンドを使用して、必要なパッケージをインストールします。
pip install -r requirements.txt
次のコマンドを使用してチャットボット アプリケーションを実行します。
python src/gradio_chatbot.py
Gradio アプリが起動したら、ドキュメント (PDF または CSV) をアップロードし、モデル (埋め込みと生成) を選択し、調整可能なパラメーターを調整し、システム プロンプトを操作して、必要なことを尋ねます。