В этом проекте реализован эффективный вывод моделей Mixtral-8x7B.
Таким образом, мы достигаем эффективного вывода моделей Mixtral-8x7B за счет комбинации методов:
Более подробную информацию о наших методах и результатах можно найти в нашем техническом отчете.
Чтобы попробовать эту демонстрацию, используйте демонстрационный блокнот: ./notebooks/demo.ipynb или
На данный момент не существует сценария командной строки для локального запуска модели. Однако вы можете создать его, используя демонстрационную записную книжку в качестве образца. При этом вклады приветствуются!
Некоторые методы, описанные в нашем техническом отчете, пока недоступны в этом репозитории. Однако мы активно работаем над добавлением их поддержки в ближайшем будущем.
Некоторые из предстоящих функций: