Команда Tongyi Qianwen открыла свою последнюю серию кодовой модели QWEN2.5-Coder, включая четыре размера моделей: 0,5B/3B/14B/32B, а также две версии базовых и инструкций. Этот шаг направлен на продвижение разработки моделей с открытым исходным кодом и предоставления разработчикам больший выбор. Модель QWEN2.5-CODER-32B-синструкции превосходно работала в генерации, ремонте и выводе кода и достигла уровней SOTA в нескольких контрольных показателях, что сравнимо с GPT-4O, особенно на языках программирования, таких как Haskell и Racket . Модель также была протестирована с помощью внутренней оценки кода -оценки Code Arena, которая доказывает свое преимущество в выравнивании предпочтений человека.
QWEN2.5-Coder поддерживает более 40 языков программирования и набирает 65,9 балла на MCEVAL и набирает 75,2 на MDEVAL BELCHMARK, рейтинг первым. Его уникальная очистка и пропорция данных на стадии предварительного обучения является одним из ключевых факторов его превосходной производительности. Модель 0,5b/1,5b/7b/14b/32b лицензирована Apache2.0, а модель 3B лицензирована только по исследованиям. Команда проверила эффективность масштабирования на кодовых LLMS, оценивая производительность моделей различных размеров. Открытый источник QWEN2.5-Coder, несомненно, будет способствовать развитию и применению технологии модели языка программирования.
Открытый исходный кодрист QWEN2.5-Coder на этот раз дает разработчикам мощный и простой в использовании выбор модели программирования, что еще больше способствует развитию сообщества с открытым исходным кодом. Модели разных размеров удовлетворяют различным потребностям, в то время как базовые и инструктирующие версии обслуживают точную настройку модели и прямое применение соответственно. Ссылка на модель предоставляется, и разработчики могут загрузить и использовать ее и внести свой вклад в сообщество с открытым исходным кодом.
QWEN2.5-CODER Модель Ссылка: https://modelscope.cn/collections/qwen25-coder-9d375446e8f5814a