Alibaba Cloud Bailian lanza Tongyi Qianwen modelo de texto largo de millones Qwen2.5-Turbo

Autor：Eve Cole Fecha de actualización：2025-01-09 17:36:01

El editor de Downcodes se enteró de que la plataforma Alibaba Cloud Bailian lanzó recientemente el modelo de texto largo Qwen2.5-Turbo. Este modelo fue desarrollado por el equipo de Tongyi Qianwen y tiene la capacidad de procesar textos ultralargos de hasta 1 millón de tokens. En el procesamiento de textos largos se han logrado avances significativos en este campo. Este avance brindará a los usuarios capacidades de procesamiento de texto más potentes y ampliará los límites de las aplicaciones de inteligencia artificial. El modelo Qwen2.5-Turbo superó al GPT-4 en múltiples evaluaciones de texto largo, demostrando sus ventajas en precisión y eficiencia, y brindando servicios más potentes a un costo menor.

Esta nueva versión del modelo logró una precisión del 100% en tareas de recuperación de textos largos y obtuvo una puntuación de 93,1 en el conjunto de evaluación de textos largos RULER, superando a GPT-4. En tareas de texto largas cercanas a escenas reales como LV-Eval y LongBench-Chat, Qwen2.5-Turbo supera a GPT-4o-mini en la mayoría de las dimensiones. En la prueba comparativa de texto breve, Qwen2.5-Turbo también tuvo un muy buen desempeño, superando significativamente al modelo de código abierto anterior con una longitud de contexto de 1 millón de tokens.

El modelo Qwen2.5-Turbo tiene una amplia gama de escenarios de aplicación, incluida la comprensión profunda de novelas, asistentes de código a gran escala, lectura de varios artículos, etc. Puede procesar 10 novelas, 150 horas de discursos o 30.000 líneas. de código al mismo tiempo. En términos de velocidad de razonamiento, el equipo de Tongyi Qianwen comprimió la cantidad de cálculo aproximadamente 12,5 veces a través del mecanismo de atención escasa y redujo el tiempo de retorno de la primera palabra del contexto de procesamiento de 1 millón de tokens de 4,9 minutos a 68 segundos, logrando un aumento de velocidad de 4,3 veces.

La plataforma Alibaba Cloud Bailian brinda a todos los usuarios la capacidad de llamar directamente a la API Qwen2.5-Turbo y ofrece un obsequio por tiempo limitado de 10 millones de tokens. El coste del uso posterior de un millón de tokens es de sólo 0,3 yuanes.

En la actualidad, la plataforma Alibaba Cloud Bailian ha lanzado más de 200 grandes modelos nacionales y extranjeros de código abierto y de código cerrado, incluidos Qwen, Llama y ChatGLM, que permiten a los usuarios llamar, entrenar y ajustar o crear aplicaciones RAG directamente.

La aparición del modelo Qwen2.5-Turbo marca un progreso significativo en la tecnología de procesamiento de textos largos. Sus amplias perspectivas de aplicación y su rendimiento eficiente brindarán más posibilidades a todos los ámbitos de la vida. La estrategia abierta de la plataforma Alibaba Cloud Bailian también proporciona a los desarrolladores un acceso conveniente y promueve el desarrollo y la aplicación de la tecnología de inteligencia artificial. ¡El editor de Downcodes espera más aplicaciones innovadoras basadas en este modelo!