Repositori ini berisi kode sumber untuk teknik Retrieval-augmented Generation (RAG), seperti yang dijelaskan dalam artikel berikut:
Bagian 1: Memulai, Rantai Pemikiran
Bagian 2: Alasan-Bertindak, percakapan multi-putaran
Bagian 3: Penyerapan PDF, pencarian vektor
Bonus: RAG dengan SLM (Model Bahasa Kecil)
Pertama, Anda perlu menjalankan server API llama.cpp dengan Phi 2:
./server -m /path/to/phi-2.Q4_K_M.gguf
(Untuk respons yang lebih lambat namun dengan akurasi yang lebih baik, pertimbangkan untuk menggunakan Mistral 7B OpenOrca).
Untuk meluncurkan Pico Jarvis, Anda memerlukan Node.js v18 atau lebih baru:
npm install npm start
lalu buka localhost:5000
.
Ajukan pertanyaan berikut:
Siapa yang menulis Kanon Kedokteran?
Apakah ramen biasanya dimakan di Mesir?
Siapa yang menyutradarai film Dark Knight?
Sebutkan destinasi wisata nomor 1 di indonesia!
Apa bahasa ibu Tuan Spock?
Negara bagian AS mana yang dimulai dengan G?
Berapa nomor atom Magnesium?
Di mana kita menemukan kanguru?
Siapa ayah Luke Skywalker?
Di negara manakah bahasa Mandarin digunakan?
Apa sungai terpanjang di Amerika Latin?
Siapa penulis teori relativitas khusus?
Logam fiksi apa yang dimasukkan ke dalam tubuh Wolverine?
Siapa yang berlayar dengan kapal andalan Santa Maria?
Sebutkan gurun besar yang dekat dengan Mongolia
Mana yang lebih dekat ke Singapura: Vietnam atau Australia?
Siapa mata-mata fiksi 007?
Negara mana yang terkenal dengan IKEA?
Sedangkan pertanyaan terkait tata surya akan terjawab dengan mencari dokumen PDF:
Apa itu planet katai?
Planet manakah yang disebut planet merah?
Bahan apa yang menyusun raksasa gas?
Bagaimana dengan raksasa es?
Jelaskan heliopause
Kapan Voyager 2 memasuki ruang antarbintang?
Bagaimana dengan Voyager 1?
Jika Anda mendapatkan kunci API untuk OpenWeatherMap dan menyediakannya sebagai variabel lingkungan OPENWEATHERMAP_API_KEY
, coba tanyakan hal berikut:
Bagaimana cuaca di Jakarta?
Berapa suhu saat ini di Palo Alto?
Apakah saat ini berawan di Seattle?