scratch pdf bot
1.0.0
這是一個可以回答有關 PDF 問題的聊天機器人原型。它使用 OpenAI 的 API 進行語言建模,並使用 LanceDB 進行向量儲存和檢索。
這使用 Poetry 進行依賴管理。要安裝依賴項:
$ poetry install
您還需要建立一個.env
檔案並向其中新增OPENAI_API_KEY
(請參閱.env.example
)。
下面的命令將在包含一些 PDF 的papers
目錄上運行管道。然後它將啟動 REPL,您可以在其中詢問有關 PDF 的問題。您可以鍵入「exit」或 cmd/ctrl + c 退出問答循環。
$ poetry run python main.py --pdf_directory=papers
請注意,LanceDB 資料庫包含在此儲存庫中,因此除非刪除.lancedb
目錄,否則將跳過攝取程式碼中嵌入的建立和儲存。包含此內容是為了更輕鬆地運行程式碼,而無需等待生成嵌入。
我寫了一篇簡短的部落格文章並在這裡錄製了該專案的演示影片。