document answer langchain pinecone openai
1.0.0
Langchain ให้การรวมที่ใช้งานง่ายสำหรับการประมวลผลและการสืบค้นเอกสารด้วยการฝังของ Pinecone และ Openai With this repository, you can load a PDF, split its contents, generate embeddings, and create a question-answering system using the aforementioned tools.
embbeding_doc.py
: The primary script for loading a PDF, splitting its content, generating embeddings using OpenAI, and saving them with Pinecone.constants.py
: ถือค่าคงที่ที่ใช้ในที่เก็บapp.py
: แอปพลิเคชัน Streamlit ที่ช่วยให้คุณสามารถสอบถามเอกสารที่ฝังตัวโดยใช้ห่วงโซ่การตอบคำถาม ตั้งค่าการกำหนดค่า :
คุณต้องสร้างไฟล์ config.py
ที่กำหนดสิ่งต่อไปนี้:
OPENAI_API_KEY = 'YOUR_OPENAI_API_KEY'
PINECONE_API_KEY = 'YOUR_PINECONE_API_KEY'
PINECONE_API_ENVIRONMENT = 'YOUR_PINECONE_ENVIRONMENT'
เรียกใช้ embbeding_doc.py
:
สิ่งนี้จะโหลด PDF ที่ให้ไว้แยกเนื้อหาสร้าง embeddings และบันทึกไว้ใน pinecone
$ python embbeding_doc.py
เริ่มแอปพลิเคชัน Streamlit :
Use Streamlit to run the app.py
script.
$ streamlit run app.py
เมื่อแอปพลิเคชันกำลังทำงานอยู่คุณสามารถป้อนคำถามที่เกี่ยวข้องกับเนื้อหา PDF และจะให้คำตอบที่เกี่ยวข้องโดยใช้ embeddings ที่สร้างขึ้นและห่วงโซ่การตอบคำถาม