ByteDance는 여러 벤치마크 테스트에서 GPT-4o 및 Claude3.5Sonnet을 능가하는 새로운 빈백 모델 1.5Pro를 출시하여 인공 지능 분야에서 상당한 발전을 이루었습니다. 이 모델은 혁신적인 Sparse MoE 아키텍처를 사용하여 더 적은 활성화 매개변수로 7배 매개변수 Dense 모델과 동등한 성능을 달성하고 효율성은 약 3배 증가합니다. 핵심 모델 업그레이드 외에도 Doubao의 시각적 이해 모델과 실시간 음성 모델이 동시에 출시되어 다중 모드 처리 기능과 음성 상호 작용 경험이 더욱 향상되었습니다.
ByteDance는 최신 Doubao 모델 1.5Pro(Doubao-1.5-pro)를 공식 출시했습니다. 이 새로운 모델은 여러 분야에서 포괄적인 기능을 발휘하여 업계에서 잘 알려진 GPT-4o 및 Claude3.5Sonnet을 성공적으로 능가합니다. 이 모델의 출시는 인공 지능 분야에서 ByteDance의 또 다른 중요한 진전을 의미합니다.
Doubao 1.5Pro는 새로운 희소 MoE(혼합 전문가) 아키텍처를 채택하고 사전 훈련을 위해 더 작은 활성화 매개변수를 사용합니다. 이 설계의 혁신은 활성화 매개변수의 7배에 해당하는 밀도 모델 성능을 제공할 수 있어 업계의 기존 MoE 아키텍처보다 훨씬 더 효율적이게 되어 효율성이 3배 향상된다는 것입니다. 이 디자인은 지식, 코드, 추론 및 중국어와 같은 여러 평가 벤치마크에서 Doubao 모델 점수를 더욱 향상시킵니다.
ByteDance는 메인 모델 업그레이드 외에도 Doubao 시각적 이해 모델 Doubao-1.5-vision-pro 및 Doubao 실시간 음성 모델 Doubao-1.5-realtime-voice-pro도 출시했습니다. 새로운 시각적 이해 모델은 다중 모드 데이터 처리, 동적 해상도 및 세분화된 정보 이해 분야에서 포괄적인 기술 업그레이드를 거쳐 시각적 추론 및 텍스트 이해 능력을 더욱 향상시켰습니다. 동시에 실시간 음성 모델의 출시로 Doubao App은 대기 시간이 짧고 대화 중 언제든지 중단할 수 있는 기능을 통해 보다 원활한 음성 대화 경험을 달성할 수 있습니다.
ByteDance는 Doubao 모델이 훈련 과정에서 외부 모델에서 생성된 데이터를 사용하지 않았으며 모델의 독립성과 신뢰성을 보장한다고 공식적으로 밝혔습니다. 또한 모든 신제품의 가격은 변경되지 않으며 사용자는 Doubao 앱에서 새로운 기능을 직접 경험할 수 있습니다.
이번 컨퍼런스에서는 AI 분야에서 ByteDance의 지속적인 혁신 역량을 선보였을 뿐만 아니라 개발자에게 강력한 API 지원을 제공하여 인공 지능 기술의 대중화와 적용을 더욱 촉진했습니다.
Doubao 대형 모델 1.5Pro의 출시와 지원되는 시각 및 음성 모델은 AI 분야에서 ByteDance의 강력한 강점과 기술 혁신을 보여줍니다. 높은 효율성, 고성능 및 사용자 경험에 대한 강조는 AI 애플리케이션이 미래에 더욱 편리하고 강력해질 것임을 나타냅니다.