Beijing Zhipu Huazhang Technology Co., Ltd.는 2025년 1월 16일에 새로운 엔드 투 엔드 모델 GLM-Realtime과 업그레이드된 GLM-4-Air, GLM-4V-Plus 및 기타 버전을 포함하여 일련의 주요 업데이트를 발표했습니다. 모든 모델은 bigmodel.cn 플랫폼에 출시되었습니다. 이번 업데이트는 언어, 음성, 이미지 및 비디오와 같은 다양한 양식을 다루며 다중 모드 대형 모델 기술 분야에서 Zhipu의 깊은 축적과 혁신 역량을 입증하고 특별히 Flash 전체 모드 무료 모델을 출시하여 대형 모델 적용 및 대형 모델 기술의 포괄적인 개발을 촉진합니다.
Beijing Zhipu Huazhang Technology Co., Ltd.는 2025년 1월 16일 일련의 새로운 모델 출시를 발표하고 이를 bigmodel.cn에 출시했습니다. 회사는 지난 8월 "Zhipu Qingyan" 출시에 이어 언어, 음성, 이미지 및 영상 이해 및 생성 분야를 심층적으로 탐구했으며 GLM-Voice, GLM-4V, CogView 및 CogVideoX.
이번에 출시된 새로운 엔드투엔드 모델인 GLM-Realtime은 저지연 영상 이해와 음성 상호작용을 구현하고, 아카펠라 기능을 탑재했으며, 최대 2분의 메모리와 함수 호출 기능을 지원한다. 또한 회사는 GLM-4-Air 및 GLM-4V-Plus 모델을 동시에 업그레이드했으며 업계에서 가장 강력한 성능과 비용 효율적인 언어 모델 솔루션을 제공하기 위해 최선을 다하고 있습니다. Zhipu는 항상 고급 대형 모델 기술을 통해 사회에 환원하기 위해 노력해 왔으며 개발자가 쉽게 달성할 수 있도록 언어, 텍스트 사진, 텍스트 비디오 및 이미지 이해와 같은 여러 시나리오를 포괄하는 Flash 풀 모드 무료 모델을 특별히 설정했습니다. 애플리케이션 혁신.
GLM-Realtime은 영상 통화를 위한 2분 콘텐츠 메모리 기능을 갖추고 있으며 음성 상호 작용에서 아카펠라 노래 기능을 혁신적으로 구현하여 대형 모델이 대화 중에 노래를 부를 수 있도록 합니다. 이 회사는 Realtime API를 스마트 안경 및 반려 인형에 통합하여 사용자가 스마트 비서와 실시간에 가까운 상호 작용을 경험할 수 있도록 합니다. Realtime은 자체 지식과 기능을 활용하여 외부 지식과 도구를 유연하게 호출하여 더 넓은 범위의 비즈니스 시나리오로 확장할 수 있는 함수 호출 기능을 추가로 지원합니다. GLM-Realtime API는 공개 플랫폼 bigmodel.cn에서 출시되었으며 현재 무료로 호출할 수 있습니다.
GLM-4-Air는 출시 이후 높은 비용 성능으로 개발자들에게 인기를 끌었습니다. 이번에는 훈련 데이터와 프로세스를 최적화하여 일부 차원에서 성능이 거의 비슷해졌습니다. 대형 GLM-4-Plus의 경우 동시에 모델 가격을 정가의 50%로 인하해 대형 모델 적용의 문턱을 낮춘다. 시각적 이해 모델 GLM-4V-Plus도 완전히 업그레이드되었습니다. 새 버전은 다양한 공개 목록의 성능을 크게 향상시켰으며 다양한 크기의 이미지 입력에 적응하고 작은 이미지 시나리오에서 토큰 소비를 크게 줄였습니다. 4K Ultra-Clear 이미지 및 극한 종횡비 이미지의 무손실 인식을 지원하며 최대 2시간의 비디오 이해 기능을 갖추고 있어 장시간 비디오 이해 및 분석을 위한 효율적이고 정확한 솔루션을 제공합니다.
Zhipu는 개발자의 혁신을 돕기 위해 대형 모델의 포용성을 위해 특별히 사회 전체에 무료로 공개되는 Flash 시리즈 포괄 모델 API를 설정했습니다. 업계 최초의 올모달 무료 모델 시리즈로서 개발자는 언어, 다중 모드 이해 및 다중 모드 생성 기능을 무료로 호출할 수 있습니다. 가까운 시일 내에 언어 모델 GLM-4-Flash, 이미지 이해 모델 GLM-4V-Flash, 이미지 생성 모델 CogView-3-Flash 및 비디오 생성 모델 CogVideoX-Flash를 포함하여 Flash 시리즈가 완전히 업그레이드될 예정입니다.
Zhipu Huazhang가 출시한 모델 업그레이드 및 새 모델은 인공 지능 분야에서 강력한 기술적 강점을 보여줄 뿐만 아니라 대형 모델 기술의 보편화를 촉진하여 개발자와 사용자에게 더욱 편리하고 강력한 AI를 제공하겠다는 의지를 반영합니다. 도구로서 앞으로 더욱 혁신적인 애플리케이션의 출현을 기대해 볼 가치가 있습니다.