Sistem RAG tradisional sering kali kesulitan memberikan jawaban yang memuaskan ketika pengguna mengajukan pertanyaan yang tidak jelas atau ambigu tanpa memberikan konteks yang memadai. Hal ini menyebabkan tanggapan yang tidak membantu seperti "Saya tidak tahu" atau jawaban yang salah dan dibuat-buat yang diberikan oleh LLM. Repo ini berisi kode untuk meningkatkan Agen RAG tradisional.
Kami memperkenalkan Alat LangChain khusus untuk Agen RAG, yang memungkinkan Agen terlibat dalam dialog percakapan dengan pengguna ketika pertanyaan awal tidak jelas atau terlalu kabur. Dengan mengajukan pertanyaan klarifikasi, meminta pengguna untuk memberikan rincian lebih lanjut, dan menggabungkan informasi kontekstual, Agen dapat mengumpulkan konteks yang diperlukan untuk memberikan jawaban yang akurat dan bermanfaat - bahkan dari pertanyaan awal yang ambigu.
Mari kita ilustrasikan keuntungannya menggunakan contoh pertanyaan berikut: "Berapa banyak GPU yang dimiliki instans EC2 saya?".
Agen RAG tradisional tidak mengetahui instans EC2 mana yang ada dalam pikiran pengguna. Oleh karena itu, ini memberikan jawaban yang tidak terlalu membantu:
Agen RAG yang ditingkatkan dengan alat `AskHuman`` melakukan dua langkah tambahan:
Ini membantu agen yang ditingkatkan untuk memberikan jawaban yang spesifik dan bermanfaat:
Untuk menjalankan demo ini di akun AWS Anda, Anda perlu mengikuti langkah-langkah berikut:
llm
yang digunakan di Agen LangChain di demo.py
dengan LLM yang didukung oleh LangChain.sh dependencies.sh
di Terminal.KENDRA_INDEX_ID
Anda masing-masing di parameter pengambilan demo.py
.streamlit run demo.py
di Terminal. Perhatikan bahwa menerapkan indeks Kendra baru dan menjalankan demo mungkin menambah biaya tambahan pada tagihan Anda. Untuk menghindari timbulnya biaya yang tidak perlu, harap hapus Indeks Amazon Kendra jika Anda tidak menggunakannya lagi dan matikan instans SageMaker Studio jika Anda menggunakannya untuk menjalankan demo.