mixtral offloading
1.0.0
该项目实现了 Mixtral-8x7B 模型的高效推理。
综上所述,我们通过技术组合实现了 Mixtral-8x7B 模型的高效推理:
有关我们的方法和结果的更多详细信息,请参阅我们的技术报告。
要尝试此演示,请使用演示笔记本:./notebooks/demo.ipynb 或
目前,没有可用于本地运行模型的命令行脚本。但是,您可以使用演示笔记本作为参考来创建一个。话虽这么说,欢迎贡献!
我们的技术报告中描述的一些技术在此存储库中尚不可用。不过,我们正在积极努力在不久的将来增加对他们的支持。
即将推出的一些功能包括: