doc-Chatbot: gpt x pinecone x langchain
คุณสมบัติ
- สร้างหัวข้อ หลาย หัวข้อเพื่อพูดคุยเกี่ยวกับ
- จัดเก็บ ไฟล์จำนวนใดก็ได้ ในแต่ละหัวข้อ
- สร้าง แชทจำนวนใด ๆ (หน้าต่างแชท) สำหรับแต่ละหัวข้อ
- อัปโหลดไฟล์แปลงเป็น embeddings จัดเก็บ embeddings ในเนมสเปซและอัปโหลดไปยัง pinecone และลบ namespaces pinecone จากภายในเบราว์เซอร์
- จัดเก็บและ ดึงประวัติแชท โดยอัตโนมัติสำหรับการแชททั้งหมดด้วยที่เก็บข้อมูลในเครื่อง
- รองรับ
.pdf
, .docx
และ .txt
+ LangChain and Pinecone
หมายเหตุ: หากคุณต้องการตั้งค่านี้ด้วย Google Auth และ MongoDB (ตรงข้ามกับการรับรองความถูกต้องและการใช้ที่เก็บข้อมูลในท้องถิ่น) ให้ดูที่สาขานี้: MongoDB และ Auth อย่างไรก็ตาม repo นั้นเป็นสิ่งสำคัญหลายประการที่อยู่เบื้องหลังสิ่งนี้และขาดคุณสมบัติบางอย่างดังนั้นโปรดจำไว้
พื้นที่แชทหลัก 
หน้าการตั้งค่า

การตั้งค่าและการพัฒนาในท้องถิ่น
หากคุณต้องการเรียกใช้งานในเครื่องนี้และปรับใช้เวอร์ชันของคุณเองให้ทำตามขั้นตอนด้านล่าง
โคลน repo
git clone https://github.com/dissorial/doc-chatbot.git
การตั้งค่า Pinecone
คีย์ API
สร้างบัญชีบน Pinecone ไปที่ Indexes
และ Create index
ป้อนชื่อใด ๆ ใส่ 1536
สำหรับ Dimensions
และปล่อยให้ส่วนที่เหลือเป็นค่าเริ่มต้น จากนั้นไปที่ API keys
และ Create API key
ชื่อดัชนี
อธิบายตนเอง
สภาพแวดล้อม Pinecone
ติดกับชื่อดัชนีของคุณเช่น us-west2-rkw
ติดตั้งแพ็คเกจ
ตั้งค่าไฟล์ .env
ของคุณ
- เปลี่ยนชื่อ
.env.example
เป็น .env
- ไฟล์
.env
ของคุณควรมีลักษณะเช่นนี้:
สภาพแวดล้อมของโหนด
- การพัฒนาตามค่าเริ่มต้น ในการผลิตตั้งค่าสิ่งนี้เป็น 'การผลิต' (โดยไม่มีคำพูด)
อื่น
- ใน
utils/makechain.ts
ปรับ QA_PROMPT
สำหรับ usecase ของคุณเอง เปลี่ยน modelName
new OpenAI
เป็น gpt-4
ใหม่หากคุณสามารถเข้าถึงได้
การปรับใช้
เพิ่มสิ่งเหล่านี้ลงในไฟล์ .env
ของคุณ:
NEXTAUTH_URL=http://localhost:3000
NEXTAUTH_SECRET=
JWT_SECRET=
ความลับ Nextauth
- คุณสามารถสร้างสิ่งนี้ได้โดยใช้
openssl rand -base64 32
ใน Git Bash
JWT Secret
- คุณสามารถสร้างสิ่งนี้ได้โดยใช้
openssl rand -base64 32
ใน Git Bash
url nextauth
- ค่าเริ่มต้นคือ http: // localhost: 3000 ในการผลิตนี่ควรเป็น URL ของแอพที่คุณปรับใช้
เรียกใช้แอพ
การแก้ไขปัญหา
ข้อผิดพลาดทั่วไป
- ตรวจสอบให้แน่ใจว่าคุณใช้โหนดเวอร์ชันล่าสุด เพื่อตรวจสอบเวอร์ชันของคุณเรียกใช้โหนด -v
- หากคุณกำลังพบปัญหากับไฟล์เฉพาะลองแปลงเป็นข้อความก่อนหรือลองใช้ไฟล์อื่น เป็นไปได้ว่าไฟล์จะเสียหายสแกนหรือต้องการให้ OCR ถูกแปลงเป็นข้อความ
- ยืนยันว่าคุณใช้ Langchain และ Pinecone เวอร์ชันเดียวกันกับที่เก็บนี้
ข้อผิดพลาด Pinecone
- ยืนยันว่าคุณตั้งค่ามิติเวกเตอร์เป็น 1536
- โปรดทราบว่าดัชนี Pinecone สำหรับผู้ใช้ในแผนเริ่มต้น (ฟรี) จะถูกลบหลังจากไม่มีการใช้งาน 7 วัน เพื่อป้องกันสิ่งนี้ให้ส่งคำขอ API ไปยัง Pinecone เพื่อรีเซ็ตตัวนับก่อน 7 วัน
- หากปัญหายังคงมีอยู่ให้พิจารณาเริ่มต้นใหม่ด้วยโครงการ Pinecone ใหม่ดัชนีและที่เก็บโคลน
เครดิต
ที่เก็บนี้เดิมเป็นส้อมของที่เก็บ GPT-4 & Langchain โดย Mayooear แต่ได้รับการเปลี่ยนแปลงที่สำคัญมากมายใน repo นี้
ส่วนหน้าของ repo นี้ได้รับแรงบันดาลใจจาก CHATGPT