Doc-Chatbot: GPT x Pinecone x Langchain
Fitur
- Membuat beberapa topik untuk mengobrol
- Simpan sejumlah file ke setiap topik
- Buat sejumlah obrolan (jendela obrolan) untuk setiap topik
- Unggah file, mengonversinya ke embeddings, menyimpan embeddings di namespace dan mengunggah ke pinecone, dan menghapus pinecone namespace dari dalam browser
- Menyimpan dan secara otomatis mengambil riwayat obrolan untuk semua obrolan dengan penyimpanan lokal
- Mendukung
.pdf
, .docx
dan .txt
+ LangChain and Pinecone
Catatan: Jika Anda ingin mengatur ini dengan Google Auth dan MongoDB (bukan Auth dan menggunakan penyimpanan lokal), lihat cabang ini: Mongodb-and-auth. Namun, repo itu adalah beberapa komit penting di balik yang satu ini dan tidak memiliki fitur tertentu, jadi ingatlah itu.
Area obrolan utama 
Halaman Pengaturan

Pengaturan & Pengembangan Lokal
Jika Anda ingin menjalankan ini secara lokal dan menggunakan versi Anda sendiri, ikuti langkah -langkah di bawah ini.
Kloning repo
git clone https://github.com/dissorial/doc-chatbot.git
Pengaturan Pinecone
Kunci API
Buat akun di Pinecone. Buka Indexes
dan Create index
. Masukkan nama apa pun, letakkan 1536
untuk Dimensions
dan biarkan sisanya secara default. Kemudian buka API keys
dan Create API key
.
Nama Indeks
Cukup jelas
Lingkungan Pinecone
Tepat di sebelah nama indeks Anda, misalnya us-west2-rkw
Instal Paket
Siapkan file .env
Anda
- Ganti nama
.env.example
menjadi .env
- File
.env
Anda akan terlihat seperti ini:
Lingkungan simpul
- Pengembangan secara default. Dalam produksi, atur ini ke 'produksi' (tanpa kutipan)
Lainnya
- Di
utils/makechain.ts
, sesuaikan QA_PROMPT
untuk usecase Anda sendiri. Ubah modelName
di new OpenAI
ke gpt-4
, jika Anda memiliki akses ke sana.
Penyebaran
Tambahkan ini ke file .env
Anda:
NEXTAUTH_URL=http://localhost:3000
NEXTAUTH_SECRET=
JWT_SECRET=
Rahasia NextAuth
- Anda dapat menghasilkan ini dengan menjalankan
openssl rand -base64 32
di git bash.
JWT Secret
- Anda dapat menghasilkan ini dengan menjalankan
openssl rand -base64 32
di git bash.
URL NextAuth
- Default adalah http: // localhost: 3000. Dalam produksi, ini harus menjadi URL dari aplikasi yang Anda gunakan.
Jalankan aplikasi
Pemecahan masalah
Kesalahan umum
- Pastikan Anda menjalankan versi node terbaru. Untuk memeriksa versi Anda, jalankan node -v.
- Jika Anda menghadapi masalah dengan file tertentu, coba konversi ke SMS terlebih dahulu atau coba file yang berbeda. Mungkin saja file tersebut rusak, dipindai, atau mengharuskan OCR dikonversi menjadi teks.
- Konfirmasikan bahwa Anda menggunakan versi langchain dan pinecone yang sama dengan repositori ini.
Kesalahan Pinecone
- Konfirmasikan bahwa Anda telah mengatur dimensi vektor ke 1536.
- Perhatikan bahwa indeks Pinecone untuk pengguna pada paket starter (gratis) dihapus setelah 7 hari tidak aktif. Untuk mencegah hal ini, kirim permintaan API ke Pinecone untuk mengatur ulang konter sebelum 7 hari.
- Jika masalah tetap ada, pertimbangkan untuk memulai baru dengan proyek Pinecone baru, indeks, dan repositori kloning.
Kredit
Repositori ini pada awalnya adalah garpu repositori GPT-4 & Langchain oleh Mayooear tetapi mengalami banyak perubahan besar dalam repo ini.
Frontend dari repo ini terinspirasi oleh chatgpt.