Кими выпускает новую модель SOTA: дебютирует модель мультимодального мышления k1.5 - статья AI

Автор：Eve Cole Время обновления：2025-01-27 08:48:01

Компания Beijing Dark Side of the Moon Technology Co., Ltd. недавно объявила, что ее умный помощник Кими получил серьезное обновление и запустил модель мультимодального мышления k1.5. Эта модель превосходит многие ведущие международные модели, включая GPT-4o и Claude3.5Sonnet, по возможностям мультимодального рассуждения и общего рассуждения, впервые достигая производительности мультимодального рассуждения официальной версии o1 от компании, отличной от OpenAI. Этот прорыв знаменует собой значительный прогресс Кими в области искусственного интеллекта, а стоящие за ним технологические инновации и усилия команды заслуживают внимания. Это обновление не только улучшает математические, кодовые и визуальные возможности мультимодальной обработки Кими, но также значительно расширяет возможности глубокого рассуждения модели за счет расширения контекста и улучшенных методов оптимизации стратегии, предоставляя пользователям надежную поддержку для решения сложных задач.

Недавно компания Beijing Dark Side of the Moon Technology Co., Ltd. объявила, что ее умный помощник Кими получил серьезное технологическое обновление и запустил новую мультимодальную модель мышления k1.5. Эта модель достигла лидирующего в отрасли уровня возможностей мультимодального рассуждения и общего рассуждения, что стало для Кими еще одним прорывом в области искусственного интеллекта.

Модель мультимодального мышления k1.5 — это третье крупное обновление Кими модели обучения с подкреплением серии K всего за три месяца. После математической модели k0, выпущенной в ноябре прошлого года, и модели визуального мышления k1, выпущенной в декабре, модель k1.5 показала выдающиеся результаты в тестах производительности. В режиме Short-CoT математические, кодирующие, визуальные мультимодальные и общие возможности k1.5 значительно превзошли уровни глобальных недальновидных моделей SOTA GPT-4o и Claude3.5Sonnet с преимуществом до 550%. В режиме long-CoT математические возможности, код и возможности мультимодального рассуждения k1.5 также достигли уровня официальной версии модели Longthink SOTA OpenAI o1. Это первый случай в мире, которого достигла компания, отличная от OpenAI. официальная версия o1. Версия мультимодального рассуждения.

За этим обновлением стоят неустанные усилия и инновации технической команды Кими. Впервые команда опубликовала подробный отчет о технологии обучения моделей «Кими k1.5: Масштабирование для достижения обучения с подкреплением с помощью больших языковых моделей», в котором записано исследование обучения моделей в рамках новой технологической парадигмы.

微信截图_20250121082016.png

В отчете отмечается, что ключевые нововведения модели k1.5 включают расширение длинного контекста, которое повышает эффективность обучения за счет технологии частичного расширения. Также отмечается, что увеличение длины контекста может продолжать улучшать производительность модели. Кроме того, улучшенные методы оптимизации стратегии и лаконичный дизайн структуры также обеспечивают высокую производительность модели. Стоит отметить, что модель k1.5 была совместно обучена на текстовых и визуальных данных и обладает способностью совместно рассуждать между двумя модальностями. Она особенно хорошо проявляет себя в математических способностях, хотя с ней трудно справиться с задачами геометрической графики. частично полагаться на графическое понимание Есть еще проблемы.

Чтобы еще больше улучшить способность к рассуждению с использованием короткой цепочки, команда также предложила эффективный метод long2short, используя технологию Long-CoT для улучшения модели Short-CoT, и добилась замечательных результатов в таких тестах, как AIME, MATH500 и LiveCodeBench, что значительно превосходя существующие методы цепного мышления, такие как GPT-4 и Claude Sonnet3.5.

Предварительная версия мультимодальной модели мышления k1.5 будет представлена в оттенках серого на веб-сайте Kimi.com и в последней версии приложения Kimi Smart Assistant. Если пользователи найдут кнопку переключения модели во время использования, они смогут испытать эту обновленную модель. Модель k1.5 хороша для глубоких рассуждений и может помочь пользователям решать сложные проблемы с кодом, математические проблемы и рабочие проблемы.

Компания Dark Side of the Moon Technology Co., Ltd. заявила, что продолжит ускорять модернизацию моделей обучения с подкреплением серии K в соответствии с установленной дорожной картой в 2025 году, добавляя больше модальностей, возможностей в большем количестве областей и более сильные общие возможности, открывая больше для пользователей возможность.

Ссылка на отчет github: https://github.com/MoonshotAI/kimi-k1.5

Модернизация модели Kimi k1.5 демонстрирует постоянные инновационные возможности Dark Side of the Moon Technology в области искусственного интеллекта. Ее передовой технологический уровень и планы на будущее заслуживают внимания. Я верю, что в будущем Кими предоставит пользователям более мощный интеллектуальный опыт.