mixtral offloading
1.0.0
此專案實現了 Mixtral-8x7B 模型的高效推理。
綜上所述,我們透過技術組合實現了 Mixtral-8x7B 模型的高效推理:
有關我們的方法和結果的更多詳細信息,請參閱我們的技術報告。
若要嘗試此演示,請使用演示筆記本:./notebooks/demo.ipynb 或
目前,沒有可用於本機運行模型的命令列腳本。但是,您可以使用演示筆記本作為參考來建立一個。話雖這麼說,歡迎貢獻!
我們的技術報告中描述的一些技術在此儲存庫中尚不可用。不過,我們正在積極努力在不久的將來增加對他們的支持。
即將推出的一些功能包括: