Пекинская компания Zhipu Huazhang Technology Co., Ltd. 29 августа 2024 года выпустила базовую модель нового поколения и прикладные услуги и подробно продемонстрировала ее на конференции KDD2024. Это обновление охватывает множество модальностей, таких как язык, изображения и видео, а также запускает новое приложение для пользователей C-конца, отмечая, что Zhipu добился значительного прогресса в области искусственного интеллекта, а его техническая мощь и инновационные возможности были дополнительно улучшены. . Ниже приведено подробное объяснение этого обновления.
На конференции KDD2024 компания Zhipu представила новое поколение базовых моделей, включая языковую модель GLM-4-Plus, графовую модель Винсента CogView-3-Plus, модель понимания изображений/видео GLM-4V-Plus и модель генерации видео. CogVideoX. Эти модели достигли лидирующего международного уровня в своих областях. Производительность модели GLM-4-Plus была значительно улучшена с точки зрения понимания языка, выполнения инструкций и обработки длинного текста и находится на одном уровне с моделями первого уровня, такими как GPT-4o. Модель CogView-3-Plus использует архитектуру Transformer для замены традиционной архитектуры UNet, которая оптимизирует эффект модели, а ее производительность близка к моделям первой линии, таким как MJ-V6 и FLUX. Модель GLM-4V-Plus обладает возможностями высококачественного распознавания изображений и видео, став первым отечественным API модели общего понимания видео. После выпуска версии 2B модель CogVideoX стала продолжением версии 5B с улучшенной производительностью, став лидером среди современных моделей генерации видео с открытым исходным кодом. Кроме того, компания Zhipu запустила первую в Китае услугу видеозвонков для пользователей C-конца в приложении «Qingyan APP». Эта услуга охватывает текстовый, аудио- и видеорежим и имеет возможности анализа в реальном времени, предоставляя пользователям плавный интерактивный опыт. Zhipu также объявила о бесплатном использовании API GLM-4-Flash, который имеет преимущества в скорости и производительности, позволяя пользователям быстро и бесплатно создавать эксклюзивные модели и приложения. В то же время, чтобы удовлетворить потребности различных пользователей, Zhipu предоставляет функции точной настройки модели. Жипу заявил, что продолжит двигаться вперед, заставляя машины думать как люди и предлагая пользователям более продвинутые технологии и услуги.
Кроме того, компания Zhipu запустила первую в Китае услугу видеозвонков для пользователей C-конца в приложении «Qingyan APP». Эта услуга охватывает текстовый, аудио- и видеорежим и имеет возможности анализа в реальном времени, предоставляя пользователям плавный интерактивный опыт.
Zhipu также объявила о бесплатном использовании API GLM-4-Flash, который имеет преимущества в скорости и производительности, позволяя пользователям быстро и бесплатно создавать эксклюзивные модели и приложения. В то же время, чтобы удовлетворить потребности различных пользователей, Zhipu предоставляет функции точной настройки модели.
Жипу заявил, что продолжит двигаться вперед, заставляя машины думать как люди и предлагая пользователям более продвинутые технологии и услуги.
Основные обновления:
Базовая языковая модель GLM-4-Plus: ее производительность была значительно улучшена с точки зрения понимания языка, выполнения инструкций и обработки длинных текстов, что позволяет поддерживать лидирующий международный уровень.
Базовая модель диаграммы Винсента CogView-3-Plus: имеет производительность, близкую к лучшим на данный момент моделям, таким как MJ-V6 и FLUX.
Базовая модель распознавания изображений/видео GLM-4V-Plus: обладает превосходными возможностями понимания изображений и видео, основанными на восприятии времени. Модель будет запущена на открытой платформе (bigmodel.cn) и станет первым API модели общего понимания видео в Китае.
Базовая модель генерации видео CogVideoX: после того, как версия 2B была выпущена и открыта, версия 5B также была официально открыта. Ее производительность была еще больше улучшена, и это лучший выбор среди текущих моделей генерации видео с открытым исходным кодом.
«Qingyan APP» запустило видеозвонки: первую внутреннюю услугу видеовызовов, открытую для пользователей C-конца. Функция видеовызовов «Qingyan APP» охватывает текстовые, аудио- и видеорежимы и имеет возможности анализа в реальном времени.
GLM-4-Flash API: служба вывода полностью бесплатна и предоставляет услуги тонкой настройки.
Ссылка на приложение услуги видеозвонка:
https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf
В целом, технологическое обновление Zhipu Huazhang демонстрирует свою сильную силу и непрерывные инновационные возможности в области искусственного интеллекта, предоставляет пользователям более передовые технологии и услуги и придаёт новую жизнь развитию индустрии искусственного интеллекта.