llm agent
1.0.0
LLM ที่ใช้ RAG ใช้หน่วยความจำระยะยาวผ่านฐานข้อมูลเวกเตอร์
พื้นที่เก็บข้อมูลนี้ช่วยให้โมเดลภาษาขนาดใหญ่สามารถใช้หน่วยความจำระยะยาวผ่านฐานข้อมูลเวกเตอร์ได้ (วิธีนี้เรียกว่า RAG (Retrieval Augmented Generation) ซึ่งเป็นเทคนิคที่ช่วยให้ LLM สามารถดึงข้อมูลข้อเท็จจริงจากฐานข้อมูลภายนอกได้) แอปพลิเคชันนี้สร้างขึ้นด้วย mistral-7b-instruct-v0.2.Q4_K_M.gguf (โดยใช้การเชื่อมโยง LLAMA_cpp_python) และ chromadb ผู้ใช้สามารถขอเพิ่มข้อมูลลงใน db ในภาษาธรรมชาติ ค้นหาข้อมูลจาก db หรืออินเทอร์เน็ตโดยใช้คำแนะนำ
You > Hi
LOG: [Response]
Bot < Hello! How can I assist you today?
You > Please add information to db "The user name is Rustam Akimov"
LOG: [Adding to memory]
Bot < Done!
You > Can you find on the Internet who is Pavel Durov
LOG: [Extracting question]
LOG: [Searching]
LOG: [Summarizing]
Bot < According to the search results provided, Pavel Durov is a Russian entrepreneur who co-founded Telegram Messenger Inc.
You > Please find information in db who is Rustam Akimov
LOG: [Extracting question]
LOG: [Querying memory]
Bot < According to the input memories, your name is Rustam Akimov.