Полный спектр возможностей кода Qwen2.5-Coder с открытым исходным кодом Тонги Цяньвэня равен таковому у GPT-4o.

Автор：Eve Cole Время обновления：2024-11-27 17:48:01

Редактор Downcodes узнал, что команда Tongyi Qianwen недавно открыла исходный код своей последней полной серии моделей Qwen2.5-Coder, что знаменует собой еще одну веху в области больших моделей с открытым исходным кодом. Модели серии Qwen2.5-Coder привлекли большое внимание благодаря своим мощным возможностям кодирования, разнообразным функциям и удобной практичности. Они продемонстрировали отличную производительность при генерации, исправлении и рассуждении кода, предоставляя разработчикам мощные инструменты, способствующие дальнейшему развитию открытого кода. LLM. Открытый исходный код этой серии моделей будет значительно способствовать применению и инновациям технологий искусственного интеллекта в области программирования.

Команда Tongyi Qianwen недавно объявила, что откроет исходный код своей последней серии Qwen2.5-Coder. Этот шаг направлен на содействие разработке программ LLM с открытым кодом. Qwen2.5-Coder привлек внимание своей мощью, разнообразием и практичностью. Модель Qwen2.5-Coder-32B-Instruct достигла уровня SOTA с точки зрения возможностей кода, который эквивалентен GPT-4o, демонстрируя комплексные возможности, включая генерацию кода, исправление кода и анализ кода. Он достигает максимальной производительности в нескольких тестах генерации кода и набирает оценку 73,7 в тесте Aider, что сопоставимо с GPT-4o.

Qwen2.5-Coder поддерживает более 40 языков программирования и набрал 65,9 балла на McEval, при этом особенно хорошо зарекомендовали себя такие языки, как Haskell и Racket. Это связано с уникальной очисткой и сопоставлением данных на этапе предварительного обучения. Кроме того, Qwen2.5-Coder-32B-Instruct также хорошо справляется с возможностями восстановления кода на нескольких языках программирования, набрав 75,2 балла в тесте MdEval и заняв первое место.

Чтобы проверить эффективность согласования Qwen2.5-Coder-32B-Instruct с учетом предпочтений человека, был создан тест Code Arena с внутренними аннотациями для оценки предпочтений кода. Результаты показывают, что Qwen2.5-Coder-32B-Instruct имеет преимущества в предпочтительном выравнивании.

На этот раз серия Qwen2.5-Coder включает модели с открытым исходным кодом четырех размеров, включая 0,5B/3B/14B/32B, охватывающие шесть основных размеров моделей для удовлетворения потребностей различных разработчиков. Официальный представитель предоставляет две модели: Base и Instruct. Первая служит основой для точной настройки модели, а вторая служит официально согласованной моделью чата. Существует положительная корреляция между размером модели и производительностью, и Qwen2.5-Coder обеспечивает производительность SOTA во всех размерах.

Модель 0.5B/1.5B/7B/14B/32B Qwen2.5-Coder использует лицензию Apache2.0, а модель 3B лицензируется только для исследований. Команда проверила эффективность масштабирования кода LLM, оценив производительность Qwen2.5-Coder разных размеров на всех наборах данных.

Открытый исходный код Qwen2.5-Coder предоставляет разработчикам мощный, разнообразный и практичный выбор моделей программирования, помогая продвигать разработку и применение моделей языков программирования.

Ссылка на модель Qwen2.5-Coder:

https://modelscope.cn/collections/Qwen25-Coder-9d375446e8f5814a

Короче говоря, Qwen2.5-Coder с открытым исходным кодом предоставляет разработчикам мощный инструмент, а его отличная производительность и широкая применимость будут во многом способствовать развитию области генерации кода и программирования. Мы надеемся, что Qwen2.5-Coder сможет сыграть роль в большем количестве сценариев применения в будущем.