ByteDance lança modelo Beanbao 1.5Pro, que supera GPT-4o e Claude3.5Sonnet em desempenho - artigo AI

Autor：Eve Cole Data da Última Atualização：2025-01-27 03:48:02

ByteDance lançou um novo modelo de beanbag 1.5Pro, superando GPT-4o e Claude3.5Sonnet em vários testes de benchmark, marcando seu progresso significativo no campo da inteligência artificial. Este modelo usa uma arquitetura MoE esparsa inovadora para obter desempenho equivalente ao modelo denso de parâmetro de 7 vezes com menos parâmetros de ativação e a eficiência é aumentada em cerca de 3 vezes. Além da atualização do modelo principal, o modelo de compreensão visual Doubao e o modelo de fala em tempo real foram lançados simultaneamente, aprimorando ainda mais as capacidades de processamento multimodal e a experiência de interação de voz.

A ByteDance lançou oficialmente seu mais recente modelo Doubao 1.5Pro (Doubao-1.5-pro). Este novo modelo tem um bom desempenho em recursos abrangentes em vários campos, superando com sucesso os conhecidos GPT-4o e Claude3.5Sonnet na indústria. O lançamento deste modelo marca mais um importante avanço da ByteDance no campo da inteligência artificial.

Doubao 1.5Pro adota uma nova arquitetura MoE (Mixed Expert) esparsa e usa parâmetros de ativação menores para pré-treinamento. A inovação deste design é que ele pode fornecer desempenho do modelo Denso equivalente a 7 vezes os parâmetros de ativação, tornando-o muito mais eficiente do que a arquitetura MoE convencional da indústria, proporcionando uma melhoria de eficiência de 3 vezes. Esse design faz com que o modelo Doubao tenha uma pontuação ainda melhor em vários benchmarks de avaliação, como conhecimento, código, raciocínio e chinês.

Além da atualização do modelo principal, a ByteDance também lançou o modelo de compreensão visual Doubao Doubao-1.5-vision-pro e o modelo de voz em tempo real Doubao Doubao-1.5-realtime-voice-pro. O novo modelo de compreensão visual passou por atualizações técnicas abrangentes em processamento de dados multimodais, resolução dinâmica e compreensão de informações refinadas, melhorando ainda mais suas capacidades de raciocínio visual e compreensão de texto. Ao mesmo tempo, o lançamento do modelo de fala em tempo real permite que o Doubao App alcance uma experiência de conversação por voz mais suave, com baixa latência e capacidade de interromper a qualquer momento durante a conversa.

A ByteDance declarou oficialmente que o modelo Doubao não utilizou nenhum dado gerado por modelos externos durante o processo de treinamento, garantindo a independência e confiabilidade do modelo. Além disso, os preços de todos os novos produtos permanecerão inalterados e os usuários poderão experimentar diretamente os novos recursos no aplicativo Doubao.

Esta conferência não apenas demonstrou as capacidades de inovação contínua da ByteDance no campo da IA, mas também forneceu aos desenvolvedores um forte suporte de API, promovendo ainda mais a popularização e aplicação da tecnologia de inteligência artificial.

O lançamento do modelo grande Doubao 1.5Pro, bem como os modelos visuais e de voz de suporte, demonstram a forte força e inovação tecnológica da ByteDance no campo da IA. Sua alta eficiência, alto desempenho e ênfase na experiência do usuário indicam que os aplicativos de IA serão mais convenientes e poderosos no futuro.