Модели серии Zhipu с открытым исходным кодом GLM-4-9B: возможности значительно превосходят LLaMA 3 8B

Автор：Eve Cole Время обновления：2025-01-03 20:32:01

Компания Zhipu AI выпустила модели серии GLM-4-9B, положив начало новой волне в сфере искусственного интеллекта. В эту серию входят базовые модели, модели чата с различной длиной контекста и визуальные модели. Его производительность полностью превосходит LLaMA38B и показывает превосходные результаты в различных оценках, таких как семантика, математика, рассуждения, код и знания. Лучше, чем Llama-3-8B. . Что еще более примечательно, так это то, что модели серии GLM-4-9B были выложены в открытый доступ на Github, что предоставляет ценные ресурсы разработчикам и исследователям по всему миру и в значительной степени способствует разработке и применению технологий искусственного интеллекта.

Компания Zhipu объявила о выпуске серии моделей GLM-4-9B, включая базовые модели, модели чата с разной длиной контекста и визуальные модели. Ее возможности превосходят LLaMA38B во всех аспектах. Сообщается, что модели серии GLM-4-9B были выложены в открытый доступ на Github, что привлекло внимание большого количества разработчиков и исследователей. Выпуск этой серии моделей считается для компании Zhipu очередным важным прорывом в области искусственного интеллекта.

GLM-4-9B — это версия с открытым исходным кодом предтренировочной модели последнего поколения серии GLM-4, выпущенная Zhipu AI. При оценке различных наборов данных, таких как семантика, математика, рассуждения, код и знания, GLM-4-9B и его версия GLM-4-9B-Chat, адаптированная к человеческим предпочтениям, показали превосходные характеристики, превосходящие Llama-3-8B.

Помимо возможности вести несколько раундов разговоров, GLM-4-9B-Chat также имеет расширенные функции, такие как просмотр веб-страниц, выполнение кода, вызов пользовательских инструментов (вызов функции) и рассуждение по длинному тексту (поддержка контекста до 128 КБ). .

В модели этого поколения добавлена поддержка нескольких языков, включая 26 языков, включая японский, корейский и немецкий. Мы также запустили модель GLM-4-9B-Chat-1M, поддерживающую длину контекста 1 М (около 2 миллионов китайских символов), и мультимодальную модель GLM-4V-9B, основанную на GLM-4-9B.

GLM-4V-9B имеет возможность вести двуязычную многоходовую беседу на китайском и английском языках с высоким разрешением 1120*1120 при мультимодальной оценке комплексных способностей к китайскому и английскому языку, перцептивному мышлению, распознаванию текста, пониманию диаграмм и т. д. ., GLM-4V-9B занял первое место. Он показывает превосходную производительность, превосходящую GPT-4-turbo-09.04.2024, Gemini1.0Pro, Qwen-VL-Max и Claude3Opus.

Пользователи сети выразили надежду, что модели серии GLM-4-9B смогут придать новый импульс развитию технологий искусственного интеллекта, и с нетерпением ждут появления более интеллектуальных продуктов. В то же время они также выразили признательность за техническую мощь и инновационные возможности Zhipu.

Адрес открытого исходного кода: https://github.com/THUDM/GLM-4.

Адрес модельного опыта: https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary.

Открытый исходный код моделей серии GLM-4-9B будет способствовать дальнейшему открытому обмену и развитию технологий искусственного интеллекта. Мы с нетерпением ждем появления новых инновационных приложений, основанных на этой модели. Постоянные достижения Zhipu AI, несомненно, придали новую жизнь области искусственного интеллекта.