Downcodes의 편집자는 Zhipu 기술 팀이 새로운 Vincentian 그래프 모델 CogView3과 업그레이드 버전 CogView3-Plus-3B를 출시했다는 사실을 알게 되었습니다. 이 버전은 공식 오픈 소스이며 Zhipu Qingyan 앱에서 출시되었습니다. 이는 AI 지원 예술 창작 기술의 획기적인 발전을 의미하며 성능 면에서 기존 최고의 오픈 소스 모델을 능가하고 AI 예술 창작 분야에 새로운 가능성을 가져옵니다. CogView3는 캐스케이드 확산 기술을 사용하여 다단계 반복을 통해 고화질 이미지를 생성합니다. 추론 속도는 유사한 제품보다 훨씬 빠르며 사용자에게 효율적이고 편리한 창의적인 경험을 제공합니다. 이 오픈 소스 이니셔티브는 AI 이미지 생성 분야의 발전을 크게 촉진하고 개발자와 연구원에게 귀중한 리소스를 제공할 것입니다.
계단식 확산을 기반으로 한 텍스트-이미지 모델인 CogView3의 생성 프로세스는 정교합니다. 모델은 먼저 512x512 픽셀의 저해상도 이미지를 생성한 후 릴레이 확산 과정을 통해 이를 1024x1024로 증가시키고 마지막으로 다시 반복하여 2048x2048의 대형 고화질 이미지를 제공합니다. 이러한 점진적인 생성 방식은 마치 디지털 화가가 캔버스 작업을 점차적으로 개선하여 사용자에게 최고의 시각적 경험을 선사하는 것과 같습니다.
공식 평가에 따르면 CogView3의 성능은 놀랍습니다. 현재 최고의 오픈 소스 Vincent 그래프 모델인 SDXL보다 성능이 77% 더 높습니다. 더 언급할 가치가 있는 점은 CogView3의 추론 속도가 SDXL의 10분의 1에 불과하다는 점입니다. 이는 모델 최적화 분야에서 Zhipu 팀의 뛰어난 성과를 충분히 보여줍니다.
이 최첨단 기술을 탐구하려는 개발자와 연구원을 위해 Zhipu 기술 팀은 CogView3 및 CogView3-Plus-3B의 소스 코드 저장소를 열었습니다. 이러한 움직임은 의심할 여지 없이 AI 이미지 생성 전체 분야의 급속한 발전을 촉진하고 보다 혁신적인 애플리케이션을 위한 견고한 기술 기반을 제공할 것입니다.
CogView3 시리즈 모델의 출현으로 Vincent 다이어그램 기술의 응용 전망은 더욱 넓어졌습니다. 개인 창작부터 상업 디자인까지, 교육 지원부터 엔터테인먼트 산업까지, 이 기술은 혁신적인 변화를 가져올 것으로 예상됩니다. 가까운 미래에는 AI를 활용한 창작이 일반화되어 더 많은 사람들이 자신의 예술적 아이디어를 쉽게 실현할 수 있을 것으로 예상됩니다.
오픈 소스 창고 주소:
https://top.aibase.com/tool/cogview3
또한 오픈 소스 모델 웨어하우스:
https://top.aibase.com/tool/cogview3-plus-3b
CogView3 및 CogView3-Plus-3B의 오픈 소스는 AI 예술 창작의 대중화와 개발을 가속화하고 모든 계층에 새로운 기회를 가져올 것입니다. Downcodes의 편집자는 이 모델을 기반으로 하는 더욱 혁신적인 응용 프로그램의 출현을 기대합니다!