Alibaba Cloud Bailian lança Tongyi Qianwen com milhões de modelos de texto longo Qwen2.5-Turbo - artigo de IA

Autor：Eve Cole Data da Última Atualização：2025-01-26 01:00:01

A plataforma Alibaba Cloud Bailian lançou o modelo de texto longo Qwen2.5-Turbo milhão. Este modelo foi desenvolvido pela equipe Tongyi Qianwen e tem a capacidade de processar texto ultralongo de até 1 milhão de tokens, o que equivale a 1 milhão de inglês. palavras ou 150 dez mil caracteres chineses. Este modelo alcançou excelentes resultados na recuperação de textos longos, conjunto de avaliação de textos longos RULER e tarefas de textos longos próximas a cenas reais, superando o GPT-4 em múltiplas dimensões. Além disso, também teve um bom desempenho no teste de benchmark de texto curto, superando significativamente modelos similares anteriores.

Alibaba Cloud Bailian Platform anunciou recentemente o lançamento do modelo de texto longo Qwen2.5-Turbo de milhões. O modelo Qwen2.5-Turbo foi desenvolvido pela equipe Tongyi Qianwen e suporta processamento de contextos ultralongos de até 1 milhão de tokens. equivale a 1 milhão de palavras em inglês ou 1,5 milhão de caracteres chineses.

Esta nova versão do modelo alcançou 100% de precisão em tarefas de recuperação de textos longos e obteve pontuação de 93,1 no conjunto de avaliação de textos longos RULER, superando o GPT-4. Em tarefas de texto longo próximas a cenas reais, como LV-Eval e LongBench-Chat, o Qwen2.5-Turbo supera o GPT-4o-mini na maioria das dimensões. No teste de benchmark de texto curto, o Qwen2.5-Turbo também teve um desempenho muito bom, superando significativamente o modelo de código aberto anterior com um comprimento de contexto de 1 milhão de tokens.

微信截图_20241121082702.png

O modelo Qwen2.5-Turbo possui uma ampla gama de cenários de aplicação, incluindo compreensão profunda de romances, assistentes de código em grande escala, leitura de vários artigos, etc. Ele pode processar 10 romances, 150 horas de discursos ou 30.000 linhas de código de uma só vez. Em termos de velocidade de raciocínio, a equipe de Tongyi Qianwen comprimiu o valor do cálculo em cerca de 12,5 vezes por meio do mecanismo de atenção esparsa e reduziu o tempo de retorno da primeira palavra do contexto de processamento de 1 milhão de tokens de 4,9 minutos para 68 segundos, alcançando um aumento de velocidade de 4,3 vezes.

A plataforma Alibaba Cloud Bailian oferece a todos os usuários a capacidade de chamar diretamente a API Qwen2.5-Turbo e oferece um presente por tempo limitado de 10 milhões de tokens. O custo do uso subsequente de um milhão de tokens é de apenas 0,3 yuans.

Atualmente, a plataforma Alibaba Cloud Bailian lançou mais de 200 grandes modelos nacionais e estrangeiros de código aberto e de código fechado, incluindo Qwen, Llama e ChatGLM, apoiando os usuários a ligar, treinar e ajustar ou criar aplicativos RAG diretamente.

O surgimento do modelo Qwen2.5-Turbo marca um progresso significativo na tecnologia de processamento de textos longos, fornecendo ferramentas de IA mais poderosas para todas as esferas da vida. A estratégia aberta da plataforma Alibaba Cloud Bailian também permite que mais desenvolvedores apliquem facilmente esta tecnologia avançada e promovam conjuntamente o desenvolvimento do campo da inteligência artificial. Seu baixo custo também reduz ainda mais o limite de uso.