Внутренняя компания ИИ Deepseek выпустила мультимодальную модель Janus-Pro, официально вступив в область литературной и биографической графики и достигла замечательных результатов. Этот продукт, основанный на обновлении модели Janusflow, превзошел известные модели, такие как Dall-E3 Openai, в нескольких тестах. Движение DeepSeek знаменует собой значительный прорыв в мультимодальной технологии ИИ и внедряет новую жизненную силу в развитие внутреннего ИИ.
Домашняя Big Model Deepseek выпустила новую мультимодальную большую модель Janus-Pro, официально входящую в область литературной и биографической графики. Этот шаг знаменует собой серьезный прорыв в DeepSeek в мультимодальной технологии искусственного интеллекта.
В Женевальных и DPG-Bench Clardmars Janus-Pro-7b не только превосходит Dall-E3 Openai, но и превосходит популярные модели, такие как стабильная диффузия и Emu3-Gen. Janus-Pro принимает протокол MIT с открытым исходным кодом, что означает, что его можно использовать в коммерческих сценариях без ограничений. Deepseek сказал, что Janus-Pro-премиальная версия макета Janusflow, выпущенной 13 ноября 2024 года.
По сравнению с моделями предыдущего поколения, Janus-Pro оптимизировал стратегию обучения, расширила учебные данные, а шкала модели была больше. Эти улучшения позволили Janus-Pro добиться значительного прогресса в мультимодальном понимании и возможностях отслеживания инструкций текста до изображения, одновременно повышая стабильность генерации текста до изображения.
Хотя Janus-Pro может обрабатывать изображения только с разрешением 384x384, уже удивительно иметь возможность достигать такого уровня, учитывая ее компактную модель.
Как мультимодальная модель, Janus-Pro может не только генерировать изображения, но и описывать изображения, идентифицировать достопримечательности, идентифицировать текст на изображениях и представлять знания на изображениях.
Очки:
DeepSeek выпускает мультимодальную модель Janus-Pro, чтобы войти в область литературной и биографической графики.
В тестах, Janus-Pro-7B Performance превосходит популярные модели, такие как Dall-E3 Openai.
Janus-Pro использует протокол MIT с открытым исходным кодом и может использоваться в коммерческих сценариях без ограничений.
Появление Janus-Pro указывает на то, что технологическая сила крупных моделей домашних хозяйств в области литературных и биографических изображений быстро растет. к!