Langchain memberikan integrasi yang mudah digunakan untuk memproses dan meminta dokumen dengan Pinecone dan embeddings Openai. Dengan repositori ini, Anda dapat memuat PDF, membagi isinya, menghasilkan embeddings, dan membuat sistem jawaban pertanyaan menggunakan alat yang disebutkan di atas.
embbeding_doc.py
: skrip utama untuk memuat PDF, membagi kontennya, menghasilkan embeddings menggunakan openai, dan menyimpannya dengan pinecone.constants.py
: Memegang konstanta yang digunakan di seluruh repositori.app.py
: A Streamlit application that allows you to query the embedded documents using a question-answering chain. Mengatur konfigurasi :
Anda harus membuat file config.py
yang mendefinisikan yang berikut:
OPENAI_API_KEY = 'YOUR_OPENAI_API_KEY'
PINECONE_API_KEY = 'YOUR_PINECONE_API_KEY'
PINECONE_API_ENVIRONMENT = 'YOUR_PINECONE_ENVIRONMENT'
Jalankan embbeding_doc.py
:
Ini akan memuat PDF yang disediakan, membagi kontennya, menghasilkan embeddings, dan menyimpannya untuk melakukan pinecone.
$ python embbeding_doc.py
Mulai aplikasi streamLit :
Gunakan StreamLit untuk menjalankan skrip app.py
$ streamlit run app.py
Setelah aplikasi berjalan, Anda dapat memasukkan pertanyaan yang terkait dengan konten PDF, dan itu akan memberikan jawaban yang relevan dengan menggunakan embeddings yang dibuat dan rantai pertanyaan.