국내 AI Company Deepseek은 Janus-Pro Multimodal 모델을 발표하여 공식적으로 문학 및 전기 그래픽 분야에 들어가서 놀라운 결과를 달성했습니다. 이 제품은 Janusflow 모델 업그레이드를 기반으로 한 강력한 벤치 마크에서 OpenAi의 Dall-E3와 같은 잘 알려진 모델을 능가했습니다. DeepSeek의 움직임은 멀티 모달 AI 기술에서 상당한 돌파구를 표시하고 국내 AI 개발에 새로운 활력을 주입합니다.
국내 빅 모델 DeepSeek은 새로운 Janus-Pro Multimodal Big Model을 출시하여 공식적으로 문학 및 전기 그래픽 분야에 들어갔다. 이 움직임은 멀티 모달 AI 기술의 Deepseek에서 큰 획기적인 획기적인 것입니다.
Geneval 및 DPG-Bench 벤치 마크에서 Janus-Pro-7B는 OpenAI의 Dall-E3를 능가 할뿐만 아니라 안정적인 확산 및 EMU3-Gen과 같은 인기있는 모델을 능가합니다. Janus-Pro는 MIT 오픈 소스 프로토콜을 채택하므로 제한없이 상용 시나리오에서 사용할 수 있습니다. Deepseek은 Janus-Pro가 2024 년 11 월 13 일에 출시 된 Janusflow Mockup의 프리미엄 버전이라고 말했다.
이전 세대 모델과 비교하여 Janus-Pro는 교육 전략을 최적화하고 교육 데이터를 확장했으며 모델 척도가 더 컸습니다. 이러한 개선으로 인해 Janus-Pro는 텍스트-이미지 생성 안정성을 향상시키면서 멀티 모드 이해 및 텍스트-이미지 명령어 추적 기능에서 상당한 진전을 이룰 수있었습니다.
Janus-Pro는 384x384 해상도로 이미지를 처리 할 수 있지만, 컴팩트 한 모델 크기로 인해 그러한 수준에 도달 할 수 있다는 것은 이미 놀라운 일입니다.
Multimodal 모델로서 Janus-Pro는 이미지를 생성 할뿐만 아니라 이미지를 설명하고, 랜드 마크 명소를 식별하고, 이미지에서 텍스트를 식별하며, 이미지에서 지식을 소개 할 수 있습니다.
전철기:
DeepSeek은 Janus-Pro Multimodal 모델을 출시하여 문학 및 전기 그래픽 분야에 들어갑니다.
벤치 마크에서 Janus-Pro-7B 성능은 OpenAi의 Dall-E3와 같은 인기있는 모델을 능가합니다.
Janus-Pro는 MIT 오픈 소스 프로토콜을 사용하며 제한없이 상용 시나리오에서 사용할 수 있습니다.
Janus-Pro의 출현은 문학 및 전기 사진 분야의 국내 대형 모델의 기술 강점이 빠르게 상승하고 있음을 나타냅니다. 에게!