mixtral offloading
1.0.0
このプロジェクトは、Mixtral-8x7B モデルの効率的な推論を実装します。
要約すると、次の手法を組み合わせることにより、Mixtral-8x7B モデルの効率的な推論を実現します。
私たちの方法と結果の詳細については、技術レポートを参照してください。
このデモを試すには、デモ ノートブック: ./notebooks/demo.ipynb または
現時点では、モデルをローカルで実行するために使用できるコマンド ライン スクリプトはありません。ただし、デモ ノートブックを参照として使用して作成することはできます。そうは言っても、貢献は大歓迎です!
技術レポートで説明されている一部のテクニックは、このリポジトリではまだ利用できません。ただし、近い将来、それらのサポートを追加することに積極的に取り組んでいます。
今後の機能の一部は次のとおりです。