Lanzhou Technology открыла исходный код своей большой модели Mencius 3-13B, что знаменует собой еще один шаг вперед в области больших моделей с открытым исходным кодом в Китае. Модель основана на архитектуре Llama и обучена с использованием набора данных 3T Tokens, показывая отличную производительность в различных тестах производительности. Технология Lanzhou упрощает процесс развертывания модели, облегчает пользовательскую настройку и оптимизацию, а также снижает порог для применения больших моделей.
Lanzhou Technology опубликовала новости с открытым исходным кодом о большой модели Mencius 3-13B. Эта большая модель основана на архитектуре Llama, обучена на наборе данных 3T Tokens и хорошо показала себя в тестах производительности. Lanzhou Technology обеспечивает простые операции развертывания, а пользователи могут настраивать и оптимизировать модели. Большая модель Mencius 3-13B с открытым исходным кодом будет способствовать развитию и применению технологий искусственного интеллекта.
Открытый исходный код большой модели Mencius 3-13B будет способствовать широкому применению и развитию технологий искусственного интеллекта в научных кругах и промышленности, предоставит ценные ресурсы для большего числа разработчиков и исследователей, а также будет способствовать дальнейшему развитию и инновациям технологий искусственного интеллекта. Мы с нетерпением ожидаем появления новых инновационных приложений на основе этой модели в будущем.