Proyek ini mengimplementasikan inferensi efisien model Mixtral-8x7B.
Singkatnya, kami mencapai inferensi model Mixtral-8x7B yang efisien melalui kombinasi teknik:
Untuk informasi lebih rinci tentang metode dan hasil kami, silakan merujuk ke laporan teknologi kami.
Untuk mencoba demo ini, silakan gunakan demo notebook: ./notebooks/demo.ipynb atau
Untuk saat ini, tidak ada skrip baris perintah yang tersedia untuk menjalankan model secara lokal. Namun, Anda bisa membuatnya menggunakan buku catatan demo sebagai referensi. Meskipun demikian, kontribusi dipersilakan!
Beberapa teknik yang dijelaskan dalam laporan teknis kami belum tersedia di repo ini. Namun, kami secara aktif berupaya menambahkan dukungan untuk mereka dalam waktu dekat.
Beberapa fitur yang akan datang adalah: