Alibaba Cloud Bailian запускает миллионную текстовую модель Tongyi Qianwen Qwen2.5-Turbo - статья об искусственном интеллекте

Автор：Eve Cole Время обновления：2025-01-26 01:00:01

Платформа Alibaba Cloud Bailian запустила модель длинного текста Qwen2.5-Turbo. Эта модель была разработана командой Tongyi Qianwen и способна обрабатывать сверхдлинный текст объемом до 1 миллиона токенов, что эквивалентно 1 миллиону английских символов. слов или 150 Десять тысяч китайских иероглифов. Эта модель достигла отличных результатов в поиске длинного текста, наборе оценки длинного текста RULER и задачах с длинным текстом, близких к реальным сценам, превосходя GPT-4 по нескольким измерениям. Кроме того, он также показал хорошие результаты в тестовом тесте с коротким текстом, значительно превзойдя предыдущие аналогичные модели.

Платформа Alibaba Cloud Bailian недавно объявила о запуске модели длинного текста Qwen2.5-Turbo. Модель Qwen2.5-Turbo была разработана командой Tongyi Qianwen и поддерживает обработку сверхдлинных контекстов объемом до 1 миллиона токенов. эквивалентно 1 миллиону английских слов или 1,5 миллионам китайских иероглифов.

Эта новая версия модели достигла 100% точности в задачах поиска длинного текста и набрала 93,1 балла в наборе оценки длинного текста RULER, превзойдя GPT-4. В задачах с длинным текстом, близких к реальным сценам, таких как LV-Eval и LongBench-Chat, Qwen2.5-Turbo превосходит GPT-4o-mini по большинству измерений. В тестовом тесте с коротким текстом Qwen2.5-Turbo также показал себя очень хорошо, значительно превзойдя предыдущую модель с открытым исходным кодом с длиной контекста в 1 млн токенов.

微信截图_20241121082702.png

Модель Qwen2.5-Turbo имеет широкий спектр сценариев применения, включая углубленное понимание романов, крупномасштабные помощники по программированию, чтение нескольких статей и т. д. Она может обрабатывать 10 романов, 150 часов выступлений или 30 000 строк. кода одновременно. Что касается скорости рассуждения, команда Tongyi Qianwen сжала объем вычислений примерно в 12,5 раз с помощью механизма разреженного внимания и сократила время возврата первого слова при обработке контекста 1M токенов с 4,9 минут до 68 секунд, добившись увеличения скорости в 4,3 раза.

Платформа Alibaba Cloud Bailian предоставляет всем пользователям возможность напрямую вызывать Qwen2.5-Turbo API и предоставляет ограниченный по времени подарок в размере 10 миллионов токенов. Стоимость последующего использования одного миллиона токенов составляет всего 0,3 юаня.

В настоящее время платформа Alibaba Cloud Bailian запустила более 200 отечественных и зарубежных крупных моделей с открытым и закрытым исходным кодом, включая Qwen, Llama и ChatGLM, которые позволяют пользователям напрямую звонить, обучаться и настраивать или создавать приложения RAG.

Появление модели Qwen2.5-Turbo знаменует собой значительный прогресс в технологии обработки длинного текста, предоставляя более мощные инструменты искусственного интеллекта для всех сфер жизни. Открытая стратегия платформы Alibaba Cloud Bailian также позволяет большему количеству разработчиков легко применять эту передовую технологию и совместно способствовать развитию области искусственного интеллекта. Его низкая стоимость также еще больше снижает порог использования.