Ini adalah prototipe chatbot yang dapat menjawab pertanyaan tentang PDF. Ia menggunakan API OpenAI untuk pemodelan bahasa, dan LanceDB untuk penyimpanan dan pengambilan vektor.
Ini menggunakan Puisi untuk manajemen ketergantungan. Untuk menginstal dependensi:
$ poetry install
Anda juga harus membuat file .env
dan menambahkan OPENAI_API_KEY
ke dalamnya (lihat .env.example
).
Perintah di bawah ini akan menjalankan pipeline pada direktori papers
, yang berisi beberapa PDF. Ini kemudian akan memulai REPL di mana Anda dapat mengajukan pertanyaan tentang PDF. Anda dapat keluar dari putaran Tanya Jawab dengan mengetik "exit" atau cmd/ctrl + c.
$ poetry run python main.py --pdf_directory=papers
Perhatikan bahwa database LanceDB disertakan dalam repo ini, sehingga pembuatan dan penyimpanan penyematan dalam kode penyerapan akan dilewati kecuali Anda menghapus direktori .lancedb
. Ini disertakan untuk memudahkan menjalankan kode tanpa harus menunggu penyematan dibuat.
Saya menulis posting blog singkat dan merekam video demo proyek ini di sini.