O Doubao Big Model da ByteDance fez um progresso notável em apenas sete meses. Sua versão mais recente, Doubao-pro-1215, está totalmente no mesmo nível do GPT-4 em termos de desempenho geral e supera o último em alguns campos profissionais. Esta medida marca que o grande modelo de tecnologia da China entrou oficialmente no primeiro escalão do mundo, injetando um forte impulso no desenvolvimento da indústria de inteligência artificial da China. O modelo grande do saco de feijão não só alcança um avanço tecnológico, mas também tem vantagens significativas em termos de custo-benefício, o que deverá acelerar a popularização e aplicação da tecnologia de modelos grandes e promover a aplicação generalizada da tecnologia de inteligência artificial em todas as esferas da vida.
Doubao Big Model, uma subsidiária da ByteDance, divulgou hoje seu relatório anual de progresso tecnológico de 2024, revelando que sua versão mais recente, Doubao-pro-1215, alcançou alinhamento total com GPT-4 em termos de desempenho geral e mostrou capacidades mais fortes em algumas áreas profissionais. Este progresso marca que a tecnologia de grandes modelos da China entrou oficialmente no primeiro escalão do mundo.
Desde a sua estreia em maio deste ano, o modelo de saco de feijão grande alcançou uma melhoria de capacidade de 32% em apenas 7 meses. De acordo com a introdução oficial, Doubao fez progressos significativos na compreensão da precisão e da qualidade da geração, otimizando o processamento massivo de dados e inovando a arquitetura do modelo, incluindo a melhoria da dispersão do modelo e a introdução de aprendizagem por reforço e outros meios técnicos. Principalmente em cenários complexos como matemática e conhecimento profissional, seu desempenho supera até o GPT-4, enquanto o preço do serviço é apenas um oitavo deste último.
Vale destacar que Doubao divulgou pela primeira vez sua capacidade de processamento de texto ultralongo de 3 milhões de palavras, o que significa que pode processar simultaneamente conteúdos equivalentes a “centenas” de relatórios acadêmicos. Usando algoritmos de dados contextuais como STRING, bem como soluções otimizadas de esparsificação e distribuição, Doubao controla o atraso de processamento de milhões de tokens em 15 segundos, melhorando significativamente a eficiência de processamento do modelo para conhecimento externo massivo.
Este avanço tecnológico não só demonstra o rápido desenvolvimento da tecnologia de IA da China, mas também indica que a popularização de aplicações de grandes modelos pode ser acelerada devido ao melhor desempenho de custos.
A iteração rápida e o excelente desempenho do grande modelo Doubao não representam apenas a ascensão da tecnologia de inteligência artificial da China, mas também indicam que, no futuro, a tecnologia dos grandes modelos servirá o público com custos mais baixos e com maior eficiência, promovendo o desenvolvimento da inteligência artificial. a tecnologia em vários campos. A aplicação em profundidade traz mais possibilidades para o desenvolvimento social.