Alibaba Cloud Bailian lança modelo de texto longo Tongyi Qianwen com milhão de milhões Qwen2.5-Turbo

Autor：Eve Cole Data da Última Atualização：2025-01-09 17:36:01

O editor do Downcodes aprendeu que a plataforma Alibaba Cloud Bailian lançou recentemente o modelo de texto longo Qwen2,5-Turbo milhões. Este modelo foi desenvolvido pela equipe Tongyi Qianwen e tem a capacidade de processar textos ultralongos de até 1 milhão de tokens. No processamento de textos longos Avanços significativos foram feitos neste campo. Esta inovação trará aos usuários capacidades de processamento de texto mais poderosas e expandirá os limites das aplicações de IA. O modelo Qwen2.5-Turbo superou o GPT-4 em múltiplas avaliações de texto longo, demonstrando suas vantagens em precisão e eficiência, além de fornecer serviços mais poderosos a um custo menor.

Esta nova versão do modelo alcançou 100% de precisão em tarefas de recuperação de textos longos e obteve pontuação de 93,1 no conjunto de avaliação de textos longos RULER, superando o GPT-4. Em tarefas de texto longo próximas a cenas reais, como LV-Eval e LongBench-Chat, o Qwen2.5-Turbo supera o GPT-4o-mini na maioria das dimensões. No teste de benchmark de texto curto, o Qwen2.5-Turbo também teve um desempenho muito bom, superando significativamente o modelo de código aberto anterior com um comprimento de contexto de 1 milhão de tokens.

O modelo Qwen2.5-Turbo possui uma ampla gama de cenários de aplicação, incluindo compreensão profunda de romances, assistentes de código em grande escala, leitura de vários artigos, etc. Ele pode processar 10 romances, 150 horas de discursos ou 30.000 linhas de código de uma só vez. Em termos de velocidade de raciocínio, a equipe de Tongyi Qianwen comprimiu o valor do cálculo em cerca de 12,5 vezes por meio do mecanismo de atenção esparsa e reduziu o tempo de retorno da primeira palavra do contexto de processamento de 1 milhão de tokens de 4,9 minutos para 68 segundos, alcançando um aumento de velocidade de 4,3 vezes.

A plataforma Alibaba Cloud Bailian oferece a todos os usuários a capacidade de chamar diretamente a API Qwen2.5-Turbo e oferece um presente por tempo limitado de 10 milhões de tokens. O custo do uso subsequente de um milhão de tokens é de apenas 0,3 yuans.

Atualmente, a plataforma Alibaba Cloud Bailian lançou mais de 200 grandes modelos nacionais e estrangeiros de código aberto e de código fechado, incluindo Qwen, Llama e ChatGLM, apoiando os usuários a ligar, treinar e ajustar ou criar aplicativos RAG diretamente.

O surgimento do modelo Qwen2.5-Turbo marca um progresso significativo na tecnologia de processamento de textos longos. Suas amplas perspectivas de aplicação e desempenho eficiente trarão mais possibilidades para todas as esferas da vida. A estratégia aberta da plataforma Alibaba Cloud Bailian também fornece aos desenvolvedores acesso conveniente e promove o desenvolvimento e aplicação de tecnologia de IA. O editor do Downcodes espera por aplicações mais inovadoras baseadas neste modelo!