¡Llama perdió peso y se convirtió en Mamba en 3 días! La velocidad de inferencia aumentó 1,5 veces.
Recientemente, la investigación del equipo de Mamba es llamativa: investigadores de universidades como Cornell y Princeton han "destilado" con éxito Llama, un gran modelo de Transformer, en Mamba, y han diseñado un nuevo algoritmo de decodificac
2024-12-29