Редактор Downcodes узнал, что платформа Alibaba Cloud Bailian недавно запустила модель длинного текста Qwen2.5-Turbo. Эта модель была разработана командой Tongyi Qianwen и способна обрабатывать сверхдлинные тексты объемом до 1 миллиона токенов. В области обработки длинных текстов в этой области были достигнуты значительные прорывы. Этот прорыв предоставит пользователям более мощные возможности обработки текста и расширит границы приложений искусственного интеллекта. Модель Qwen2.5-Turbo превзошла GPT-4 в многочисленных оценках длинных текстов, продемонстрировав свои преимущества в точности и эффективности, а также предоставляя более мощные услуги по более низкой цене.
Эта новая версия модели достигла 100% точности в задачах поиска длинного текста и набрала 93,1 балла в наборе оценки длинного текста RULER, превзойдя GPT-4. В задачах с длинным текстом, близких к реальным сценам, таких как LV-Eval и LongBench-Chat, Qwen2.5-Turbo превосходит GPT-4o-mini по большинству измерений. В тестовом тесте с коротким текстом Qwen2.5-Turbo также показал себя очень хорошо, значительно превзойдя предыдущую модель с открытым исходным кодом с длиной контекста в 1 млн токенов.
Модель Qwen2.5-Turbo имеет широкий спектр сценариев применения, включая углубленное понимание романов, крупномасштабные помощники по программированию, чтение нескольких статей и т. д. Она может обрабатывать 10 романов, 150 часов выступлений или 30 000 строк. кода одновременно. Что касается скорости рассуждения, команда Tongyi Qianwen сжала объем вычислений примерно в 12,5 раз с помощью механизма разреженного внимания и сократила время возврата первого слова при обработке контекста 1M токенов с 4,9 минут до 68 секунд, добившись увеличения скорости в 4,3 раза.
Платформа Alibaba Cloud Bailian предоставляет всем пользователям возможность напрямую вызывать Qwen2.5-Turbo API и предоставляет ограниченный по времени подарок в размере 10 миллионов токенов. Стоимость последующего использования одного миллиона токенов составляет всего 0,3 юаня.
В настоящее время платформа Alibaba Cloud Bailian запустила более 200 отечественных и зарубежных крупных моделей с открытым и закрытым исходным кодом, включая Qwen, Llama и ChatGLM, которые позволяют пользователям напрямую звонить, обучаться и настраивать или создавать приложения RAG.
Появление модели Qwen2.5-Turbo знаменует собой значительный прогресс в технологии обработки длинных текстов. Ее широкие перспективы применения и эффективная производительность откроют больше возможностей для всех сфер жизни. Открытая стратегия платформы Alibaba Cloud Bailian также предоставляет разработчикам удобный доступ и способствует разработке и применению технологий искусственного интеллекта. Редактор Downcodes с нетерпением ждет новых инновационных приложений на основе этой модели!