Ce projet implémente une inférence efficace de modèles Mixtral-8x7B.
En résumé, nous obtenons une inférence efficace des modèles Mixtral-8x7B grâce à une combinaison de techniques :
Pour des informations plus détaillées sur nos méthodes et nos résultats, veuillez vous référer à notre rapport technique.
Pour essayer cette démo, veuillez utiliser le carnet de démonstration : ./notebooks/demo.ipynb ou
Pour l’instant, aucun script de ligne de commande n’est disponible pour exécuter le modèle localement. Cependant, vous pouvez en créer un en utilisant le carnet de démonstration comme référence. Ceci étant dit, les contributions sont les bienvenues !
Certaines techniques décrites dans notre rapport technique ne sont pas encore disponibles dans ce référentiel. Cependant, nous travaillons activement à l'ajout d'un support pour eux dans un avenir proche.
Certaines des fonctionnalités à venir sont :