최근 몇몇 주요 인공 지능 회사는 대규모 언어 모델 분야에서 상당한 진전을 이루었으며 모델 성능과 사용자 경험 개선을 목표로 하는 새로운 모델과 기능을 출시했습니다. 이러한 업데이트에는 컨텍스트 길이 개선, 모델 아키텍처 개선, 엔터프라이즈 수준 애플리케이션 지원이 포함되어 AI 기술의 지속적인 발전과 성숙도를 보여줍니다. 이 기사에서는 AI21 Labs, Mistral AI 및 Cohere가 최근 발표한 최신 결과에 중점을 둘 것입니다.
AI21은 SSM-Transformer 아키텍처를 채택하고 52B 매개변수를 가지며 256K 컨텍스트 길이를 지원하는 세계 최초의 Mamba 프로덕션 레벨 모델 Jamba를 출시했습니다. Jamba 모델은 SSM 기술과 Transformer 아키텍처를 결합하고 긴 텍스트 작업 처리에 탁월한 성능을 발휘합니다. MistralAI는 Mistral7Bv0.2BaseModel을 출시하여 컨텍스트를 32K로 늘리고 더 나은 AI 솔루션을 제공하기 위해 노력하고 있습니다. Cohere는 생산 규모의 인공 지능을 구현하고 기업에 확장 가능한 생성 모델을 제공하는 데 중점을 둔 Command-R을 출시했습니다.
이러한 새로운 모델의 출시는 인공지능 분야에서 지속적인 혁신의 생명력을 보여주며, 향후 대규모 언어 모델이 더욱 효율적이고 강력한 방향으로 발전할 것임을 시사합니다. 더 긴 컨텍스트 창과 더 강력한 모델 아키텍처는 사용자에게 더 풍부한 애플리케이션 경험을 제공하고 엔터프라이즈 수준 AI 애플리케이션을 위한 더 견고한 기반을 제공합니다. 앞으로도 더 많은 혁신을 기대하겠습니다.