Компания Zhipu AI выпустила новое поколение модели генерации видео CogVideoX, суть которой заключается в значительном повышении эффективности и качества генерации видео, что знаменует собой крупный прорыв компании в области мультимодальных технологий. CogVideoX реализовал множество инноваций на техническом уровне и был открыт для пользователей через платформу Zhipu Qingyan, предоставляя удобные услуги по созданию видео с помощью искусственного интеллекта и интерфейсы вызовов API для предприятий и разработчиков.
Компания Zhipu AI выпустила новое поколение модели генерации видео CogVideoX, что ознаменовало еще один важный прогресс в развитии мультимодальных технологий компании.
Основные технические характеристики CogVideoX включают в себя:
Трехмерная вариационная структура автокодировщика (3D VAE): эта структура, независимо разработанная Zhipu AI, может сжимать исходные видеоданные до 2% от исходного размера, снижая стоимость и сложность обучения. В сочетании с модулем кодирования положения 3D RoPE он улучшает возможность захвата межкадровых взаимосвязей во временном измерении и устанавливает долгосрочные зависимости в видео.
Модель сквозного понимания видео. Она расширяет возможности модели понимать текст и следовать инструкциям, гарантируя, что созданное видео больше соответствует потребностям пользователя и может обрабатывать сверхдлинные и сложные подсказки.
Архитектура-трансформер, объединяющая текст, время и пространство в трех измерениях: Expert Block инновационно разработан для выравнивания модальных пространств текста и видео и оптимизирует взаимодействие между модальностями с помощью механизма полного внимания.
Модель CogVideoX была запущена на ПК, в мобильных приложениях и мини-программах Zhipu Qingyan. Пользователи могут бесплатно пользоваться услугами видео, генерируемого AI, и видео, генерируемого с помощью функции «Ying». К основным особенностям Qingying относятся быстрая генерация, эффективное выполнение команд, согласованность контента и гибкость планирования экрана.
Кроме того, bigmodel.cn, открытая платформа для больших моделей, также внедрила Qingying, и предприятия и разработчики могут использовать ее функции через вызовы API. Zhipu AI подтвердил эффективность закона масштабирования в области генерации видео и продолжит расширять масштаб данных и масштаб модели, а также исследовать новые архитектуры моделей для более эффективного сжатия видеоинформации и более полной интеграции текстового и видеоконтента.
Адрес опыта: https://top.aibase.com/tool/qingying-ai-shipinshengchengfuwu
Запуск CogVideoX не только предоставляет пользователям более удобный опыт создания видео с помощью искусственного интеллекта, но также указывает на то, что технология создания видео с использованием искусственного интеллекта откроет новый этап развития. В будущем Zhipu AI продолжит изучать более совершенные модели архитектуры и технические решения для содействия постоянному совершенствованию технологии генерации видео с помощью искусственного интеллекта.