Модель Zhipu CogView3-Plus с открытым исходным кодом и технология диаграмм Винсента открыли новую эру

Автор：Eve Cole Время обновления：2025-01-02 08:00:02

Редактор Downcodes узнал, что техническая команда Zhipu выпустила новую графическую модель Винсента CogView3 и ее обновленную версию CogView3-Plus-3B, исходный код которых официально открыт и запущен в приложении Zhipu Qingyan. Это знаменует собой крупный прорыв в технологии создания произведений искусства с помощью ИИ, превосходящий существующие ведущие модели с открытым исходным кодом по производительности и открывающий новые возможности в области создания произведений искусства с помощью ИИ. CogView3 использует технологию каскадной диффузии для создания изображений высокой четкости посредством многоэтапной итерации. Его скорость вывода намного выше, чем у аналогичных продуктов, предоставляя пользователям эффективный и удобный творческий опыт. Эта инициатива с открытым исходным кодом будет значительно способствовать развитию области создания изображений с помощью ИИ и предоставит ценные ресурсы для разработчиков и исследователей.

Поскольку CogView3 представляет собой модель преобразования текста в изображение, основанную на каскадной диффузии, процесс генерации является изысканным. Модель сначала генерирует изображение с низким разрешением 512x512 пикселей, затем увеличивает его до 1024x1024 посредством процесса релейной диффузии и, наконец, повторяет итерацию, чтобы представить большое изображение высокой четкости 2048x2048. Этот метод прогрессивного поколения подобен цифровому художнику, который постепенно совершенствует работу на холсте, предоставляя пользователям максимальное визуальное впечатление.

Согласно официальной оценке, производительность CogView3 потрясающая: ее производительность на 77% выше, чем у текущей топовой графической модели Винсента с открытым исходным кодом SDXL. Стоит еще отметить, что скорость вывода CogView3 составляет лишь одну десятую скорости вывода SDXL, что в полной мере демонстрирует выдающиеся достижения команды Zhipu в оптимизации моделей.

Для разработчиков и исследователей, желающих изучить эту передовую технологию, техническая команда Zhipu открыла репозитории исходного кода CogView3 и CogView3-Plus-3B. Этот шаг, несомненно, будет способствовать быстрому развитию всей области создания изображений с помощью ИИ и обеспечит прочную техническую основу для более инновационных приложений.

С появлением моделей серии CogView3 перспективы применения технологии диаграмм Винсента стали еще шире. Ожидается, что эта технология принесет революционные изменения: от личного творчества до коммерческого дизайна, от образовательной помощи до индустрии развлечений. Мы можем предвидеть, что в ближайшем будущем творчество с помощью ИИ станет нормой, что позволит большему количеству людей легко реализовать свои художественные идеи.

Адрес склада открытого кода:

https://top.aibase.com/tool/cogview3

Плюс склад моделей с открытым исходным кодом:

https://top.aibase.com/tool/cogview3-plus-3b

Открытый исходный код CogView3 и CogView3-Plus-3B ускорит популяризацию и развитие художественного творчества с использованием ИИ и откроет новые возможности во всех сферах жизни. Редактор Downcodes с нетерпением ждет появления более инновационных приложений на основе этой модели!