16 января 2025 года компания Beijing Zhipu Huazhang Technology Co., Ltd. выпустила серию крупных обновлений, включая новую комплексную модель GLM-Realtime и обновленные версии GLM-4-Air, GLM-4V-Plus и другие. модели Все Все модели были запущены на платформе bigmodel.cn. Это обновление охватывает различные модальности, такие как язык, голос, изображения и видео, демонстрируя глубокие накопления и инновационные возможности Zhipu в области технологии мультимодальных больших моделей, а также специально запущенную полномодальную бесплатную модель Flash с целью снизить порог для применение больших моделей и содействие инклюзивному развитию технологий больших моделей.
Компания Beijing Zhipu Huazhang Technology Co., Ltd. объявила о запуске серии новых моделей 16 января 2025 года и разместила их на bigmodel.cn. После запуска «Zhipu Qingyan» в августе компания провела углубленные исследования в области понимания и генерации языка, речи, изображений и видео, а также запустила мультимодальные модели, такие как GLM-Voice, GLM-4V, CogView и CogVideoX.
Новая комплексная модель GLM-Realtime, выпущенная на этот раз, обеспечивает понимание видео и голосовое взаимодействие с малой задержкой, включает функцию капеллы и поддерживает до 2 минут памяти и функции вызова функций. Компания также одновременно обновила модели GLM-4-Air и GLM-4V-Plus и стремится предоставить самые производительные и экономичные в отрасли решения для языковых моделей. Компания Zhipu всегда стремилась принести обществу передовые технологии больших моделей и специально разработала полнорежимные бесплатные модели Flash, охватывающие множество сценариев, таких как язык, текстовые изображения, текстовые видео и понимание изображений, чтобы помочь разработчикам легко достичь инновации в приложениях.
GLM-Realtime имеет 2-минутную память для видеовызовов и инновационно реализует функцию пения а капелла при голосовом взаимодействии, позволяя крупным моделям петь во время разговора. Компания интегрирует API Realtime в умные очки и куклы-компаньоны, чтобы пользователи могли взаимодействовать с умными помощниками практически в реальном времени. Realtime также поддерживает функцию вызова функций, которая может полагаться на собственные знания и возможности для гибкого вызова внешних знаний и инструментов для расширения спектра бизнес-сценариев. GLM-Realtime API был запущен на открытой платформе bigmodel.cn, и в настоящее время его можно использовать бесплатно.
GLM-4-Air пользовался популярностью среди разработчиков благодаря своей высокой экономичности с момента своего запуска. На этот раз он был полностью обновлен до GLM-4-Air-0111. За счет оптимизации данных и процессов обучения его производительность по некоторым параметрам близка к уровню GLM-4-Air-0111. чем у более крупного GLM-4-Plus, в то же время цена модели снижается до 50% от первоначальной цены, что снижает порог для применения большой модели. Модель визуального понимания GLM-4V-Plus также была полностью обновлена. Новая версия значительно улучшила производительность в нескольких общедоступных списках. Она поддерживает функцию переменного разрешения, адаптируется к вводу изображений разных размеров, значительно снижает потребление токенов в сценариях с небольшими изображениями. и поддерживает сверхчеткое распознавание изображений без потерь и изображений с экстремальным соотношением сторон, с возможностью понимания видео до 2 часов, обеспечивая эффективные и точные решения для длительного понимания и анализа видео.
Компания Zhipu стремится обеспечить инклюзивность больших моделей. Чтобы помочь разработчикам внедрять инновации, компания специально создала API инклюзивных моделей Flash, который является бесплатным и открытым для всего общества. Это первая в отрасли полностью модальная бесплатная серия моделей, позволяющая разработчикам бесплатно вызывать функции языка, мультимодального понимания и мультимодальной генерации. В ближайшем будущем серия Flash будет полностью обновлена, включая языковую модель GLM-4-Flash, модель распознавания изображений GLM-4V-Flash, модель генерации изображений CogView-3-Flash и модель генерации видео CogVideoX-Flash.
Обновления моделей и новые модели, выпущенные Zhipu Huazhang, не только демонстрируют ее сильную техническую мощь в области искусственного интеллекта, но также отражают ее решимость способствовать универсализации технологии больших моделей, предоставляя разработчикам и пользователям более удобный и мощный ИИ. инструментов, стоит ожидать появления более инновационных приложений в будущем.