นี่คือต้นแบบของแชทบอทที่สามารถตอบคำถามเกี่ยวกับ PDF ได้ โดยใช้ API ของ OpenAI สำหรับการสร้างแบบจำลองภาษา และใช้ LanceDB สำหรับการจัดเก็บและการเรียกข้อมูลเวกเตอร์
สิ่งนี้ใช้บทกวีเพื่อการจัดการการพึ่งพา ในการติดตั้งการพึ่งพา:
$ poetry install
คุณจะต้องสร้างไฟล์ .env
และเพิ่ม OPENAI_API_KEY
ของคุณลงไป (ดู .env.example
)
คำสั่งด้านล่างจะเรียกใช้ไปป์ไลน์ในไดเร็กทอรี papers
ซึ่งมีไฟล์ PDF สองสามไฟล์ จากนั้นจะเริ่ม REPL ซึ่งคุณสามารถถามคำถามเกี่ยวกับ PDF ได้ คุณสามารถออกจากวงจรถามตอบได้โดยพิมพ์ "exit" หรือ cmd/ctrl + c
$ poetry run python main.py --pdf_directory=papers
โปรดทราบว่าฐานข้อมูล LanceDB รวมอยู่ใน repo นี้ ดังนั้นการสร้างและการจัดเก็บการฝังภายในโค้ดการนำเข้าจะถูกข้ามไป เว้นแต่คุณจะลบไดเร็กทอรี . .lancedb
รวมอยู่ด้วยเพื่อให้เรียกใช้โค้ดได้ง่ายขึ้นโดยไม่ต้องรอให้สร้างการฝัง
ฉันเขียนโพสต์บล็อกสั้นๆ และบันทึกวิดีโอสาธิตของโครงการนี้ที่นี่