A Lanzhou Technology abriu o código-fonte de seu grande modelo Mencius 3-13B, o que marca mais um passo à frente no campo de grandes modelos de código aberto na China. O modelo é baseado na arquitetura Llama e é treinado utilizando o conjunto de dados 3T Tokens, apresentando excelente desempenho em diversos testes de benchmark. A tecnologia Lanzhou simplifica o processo de implantação do modelo, facilita a personalização e otimização do usuário e reduz o limite para aplicações de modelos grandes.
A Lanzhou Technology divulgou as notícias de código aberto do modelo grande Mencius 3-13B. Este grande modelo é baseado na arquitetura Llama, treinado no conjunto de dados 3T Tokens e teve um bom desempenho em testes de benchmark. A tecnologia Lanzhou oferece operações de implantação simples e os usuários podem personalizar e otimizar modelos. O grande modelo Mencius 3-13B de código aberto promoverá o desenvolvimento e o progresso da aplicação da tecnologia de IA.
O código aberto do grande modelo Mencius 3-13B promoverá a ampla aplicação e desenvolvimento da tecnologia de IA na academia e na indústria, fornecerá recursos valiosos para mais desenvolvedores e pesquisadores e promoverá ainda mais o progresso e a inovação da tecnologia de IA. Esperamos ver aplicações mais inovadoras baseadas neste modelo no futuro.