Alibaba Cloud anunciou mais uma vez ajustes de preço para seus modelos de compreensão visual da série Tongyi Qianwen. Esta é a terceira redução de preço este ano, com uma redução de preço de mais de 80%. Esta medida reduzirá significativamente os custos dos utilizadores e promoverá ainda mais a popularização e aplicação da tecnologia de IA. Esta redução de preço abrange vários modelos, como Qwen-VL-Plus e Qwen-VL-Max. Entre eles, o preço do modelo Qwen-VL-Plus atingiu um novo mínimo em toda a rede, trazendo mais oportunidades de aplicação para desenvolvedores e. empresas.
Após duas reduções de preços em maio e setembro deste ano, a Alibaba Cloud anunciou mais uma vez reduções de preços para os seus grandes modelos, lançando a terceira ronda de ajustes de preços este ano. A redução de preço desta vez é muito significativa. O preço dos modelos de compreensão visual da série Tongyi Qianwen foi reduzido em mais de 80%.
Entre eles, o preço do modelo Qwen-VL-Plus caiu 81%, com o preço de entrada sendo de apenas 0,0015 yuan/mil tokens, estabelecendo um novo preço mais baixo em toda a rede enquanto o Qwen-VL-Max de maior desempenho; caiu de preço para 0,003 yuans/mil tokens, uma queda de 85%. De acordo com o novo preço, 1 yuan pode processar até cerca de 600 fotos 720P ou 1.700 fotos 480P.
Os grandes modelos da série Qwen-VL são grandes modelos multimodais lançados pela Alibaba Cloud. Eles se tornaram um dos modelos mais populares na comunidade de código aberto e possuem poderosas capacidades de raciocínio visual. Este modelo pode não apenas reconhecer imagens de diferentes resoluções e proporções, mas também compreender vídeos longos de mais de 20 minutos e tem a capacidade de compreensão visual para operar objetos inteligentes de forma autônoma, como telefones celulares e robôs. Qwen-VL é amplamente utilizado em cenários de reconhecimento visual de vários terminais, abrangendo telefones celulares, automóveis e outras áreas.
A equipe do Alibaba Cloud Bailian afirmou que esta redução de preço se deve principalmente à otimização contínua da infraestrutura e estrutura do modelo do Alibaba Cloud, bem como ao efeito de escala provocado pelo crescimento exponencial de grandes chamadas de modelos. Com o contínuo avanço e otimização da tecnologia, a eficiência do raciocínio do Alibaba Cloud melhorou bastante. O sistema elástico de agendamento de poder de computação de IA construído pela Alibaba Cloud, combinado com o mecanismo de aceleração de inferência distribuída Bailian, não apenas reduz significativamente o custo de inferência do modelo, mas também acelera a velocidade de inferência. Alibaba Cloud também mencionou que à medida que o efeito de compreensão visual do Qwen-VL continua a ser otimizado, este modelo se tornou um dos modelos de crescimento mais rápido na plataforma Bailian.
A fim de reduzir ainda mais o custo para os usuários usarem APIs de modelos grandes, o Alibaba Cloud Bailian também lançou um novo modelo de faturamento KV Cache. Este modo armazena automaticamente o contexto em cache para evitar cálculos repetidos, reduzindo significativamente os custos de chamada de modelo. É especialmente adequado para cenários como texto longo, conclusão de código, conversas de várias rodadas e resumos de texto específicos.
À medida que o Alibaba Cloud continua a otimizar a infraestrutura e os modelos, a redução de preço da série Qwen-VL de modelos de compreensão visual não só torna a tecnologia de IA mais acessível às pessoas, mas também traz mais oportunidades de aplicação para desenvolvedores e empresas. Ao otimizar continuamente o desempenho e reduzir os custos de utilização, a Alibaba Cloud está a promover a popularização e aplicação da tecnologia de IA e a fornecer um suporte técnico mais forte para a transformação digital de várias indústrias.
Esta redução de preço reflete a determinação da Alibaba Cloud em reduzir o limiar da tecnologia de IA e promover a IA inclusiva. Injeta uma nova vitalidade no desenvolvimento da indústria e anuncia um futuro mais amplo para as aplicações de IA.