scratch pdf bot
1.0.0
PDFに関する質問に答えるチャットボットのプロトタイプです。言語モデリングには OpenAI の API を使用し、ベクトルの保存と取得には LanceDB を使用します。
これは依存関係の管理に Poetry を使用します。依存関係をインストールするには:
$ poetry install
また、 .env
ファイルを作成し、それにOPENAI_API_KEY
を追加する必要があります ( .env.example
を参照)。
以下のコマンドは、いくつかの PDF を含むpapers
ディレクトリでパイプラインを実行します。その後、PDF について質問できる REPL が開始されます。 「exit」または cmd/ctrl + c を入力すると、Q&A ループを終了できます。
$ poetry run python main.py --pdf_directory=papers
LanceDB データベースはこのリポジトリに含まれているため、 .lancedb
ディレクトリを削除しない限り、取り込みコード内の埋め込みの作成と保存はスキップされることに注意してください。これは、埋め込みが生成されるのを待たずにコードを簡単に実行できるようにするために含まれています。
ここで簡単なブログ投稿を書き、このプロジェクトのデモビデオを録画しました。