Alibaba Cloud Bailian lanza Tongyi Qianwen modelo de texto largo Qwen2.5-Turbo - artículo de AI

Autor：Eve Cole Fecha de actualización：2025-01-26 01:00:01

Alibaba Cloud Bailian Platform ha lanzado el modelo de texto largo Qwen2.5-Turbo. Este modelo fue desarrollado por el equipo de Tongyi Qianwen y tiene la capacidad de procesar texto ultralargo de hasta 1 millón de tokens, lo que equivale a 1 millón en inglés. palabras o 150 Diez mil caracteres chinos. Este modelo ha logrado excelentes resultados en recuperación de texto largo, conjunto de evaluación de texto largo RULER y tareas de texto largo cercanas a escenas reales, superando a GPT-4 en múltiples dimensiones. Además, también obtuvo buenos resultados en la prueba comparativa de textos breves, superando significativamente a modelos similares anteriores.

Alibaba Cloud Bailian Platform anunció recientemente el lanzamiento del modelo de texto largo Qwen2.5-Turbo. El modelo Qwen2.5-Turbo fue desarrollado por el equipo de Tongyi Qianwen y admite el procesamiento de contextos ultralargos de hasta 1 millón de tokens. Equivale a 1 millón de palabras en inglés o 1,5 millones de caracteres chinos.

Esta nueva versión del modelo logró una precisión del 100% en tareas de recuperación de textos largos y obtuvo una puntuación de 93,1 en el conjunto de evaluación de textos largos RULER, superando a GPT-4. En tareas de texto largas cercanas a escenas reales como LV-Eval y LongBench-Chat, Qwen2.5-Turbo supera a GPT-4o-mini en la mayoría de las dimensiones. En la prueba comparativa de texto breve, Qwen2.5-Turbo también tuvo un muy buen desempeño, superando significativamente al modelo de código abierto anterior con una longitud de contexto de 1 millón de tokens.

微信截图_20241121082702.png

El modelo Qwen2.5-Turbo tiene una amplia gama de escenarios de aplicación, incluida la comprensión profunda de novelas, asistentes de código a gran escala, lectura de varios artículos, etc. Puede procesar 10 novelas, 150 horas de discursos o 30.000 líneas. de código al mismo tiempo. En términos de velocidad de razonamiento, el equipo de Tongyi Qianwen comprimió la cantidad de cálculo aproximadamente 12,5 veces a través del mecanismo de atención escasa y redujo el tiempo de retorno de la primera palabra del contexto de procesamiento de 1 millón de tokens de 4,9 minutos a 68 segundos, logrando un aumento de velocidad de 4,3 veces.

La plataforma Alibaba Cloud Bailian brinda a todos los usuarios la capacidad de llamar directamente a la API Qwen2.5-Turbo y ofrece un obsequio por tiempo limitado de 10 millones de tokens. El coste del uso posterior de un millón de tokens es de sólo 0,3 yuanes.

En la actualidad, la plataforma Alibaba Cloud Bailian ha lanzado más de 200 grandes modelos nacionales y extranjeros de código abierto y de código cerrado, incluidos Qwen, Llama y ChatGLM, que permiten a los usuarios llamar, entrenar y ajustar o crear aplicaciones RAG directamente.

La aparición del modelo Qwen2.5-Turbo marca un progreso significativo en la tecnología de procesamiento de textos largos, proporcionando herramientas de inteligencia artificial más potentes para todos los ámbitos de la vida. La estrategia abierta de la plataforma Alibaba Cloud Bailian también permite que más desarrolladores apliquen fácilmente esta tecnología avanzada y promuevan conjuntamente el desarrollo del campo de la inteligencia artificial. Su bajo coste también reduce aún más el umbral de uso.