Este proyecto implementa una inferencia eficiente de modelos Mixtral-8x7B.
En resumen, logramos una inferencia eficiente de los modelos Mixtral-8x7B mediante una combinación de técnicas:
Para obtener información más detallada sobre nuestros métodos y resultados, consulte nuestro informe técnico.
Para probar esta demostración, utilice el cuaderno de demostración: ./notebooks/demo.ipynb o
Por ahora, no hay ningún script de línea de comandos disponible para ejecutar el modelo localmente. Sin embargo, puedes crear uno usando el cuaderno de demostración como referencia. Dicho esto, ¡las contribuciones son bienvenidas!
Algunas técnicas descritas en nuestro informe técnico aún no están disponibles en este repositorio. Sin embargo, estamos trabajando activamente para agregarles soporte en un futuro próximo.
Algunas de las próximas características son: