Серия моделей обучения с подкреплением k1 уже здесь! Dark Side of the Moon Кими запускает модель визуального мышления

Автор：Eve Cole Время обновления：2024-12-21 10:32:01

Компания Dark Side of the Moon сегодня выпустила новую модель визуального мышления k1, которая основана на технологии обучения с подкреплением и добилась значительных прорывов в понимании изображений и рассуждении. Модель k1 не только поддерживает сквозное понимание изображений, но также интегрирует технологию цепочки мышления, расширяя сферу ее применения до областей фундаментальной науки, таких как физика и химия, и превосходя ведущие мировые модели в многочисленных тестах производительности. Его инновация заключается в интеграции возможностей понимания изображений и мышления. Пользователи могут напрямую вводить информацию об изображениях и получать ответы, не прибегая к внешним инструментам, что значительно повышает эффективность взаимодействия и удобство работы с пользователем.

Dark Side of the Moon сегодня объявила о выпуске новой модели визуального мышления k1. Эта модель основана на технологии обучения с подкреплением, которая не только поддерживает сквозное понимание изображений, но также интегрирует технологию цепочки мышления, расширяя ее возможности на более фундаментальные области науки, помимо математики, включая физику и химию. В тесте производительности модель k1 превзошла ведущие мировые модели, такие как o1 OpenAI, GPT-4o и Claude3.5Sonnet.

Модель нового поколения стимулирует генерирование более детальных шагов рассуждения для формирования качественной цепочки мышления, что значительно повышает вероятность успеха при решении сложных задач. Интеграция модели Kimi K1 в возможности понимания изображений и мышления обеспечивает пользователям более плавный интерактивный опыт. Она может напрямую обрабатывать введенную пользователем информацию об изображении и получать ответы, не прибегая к внешнему распознаванию изображений или дополнительным визуальным моделям.

微信截图_20241216100218.png

Обучение модели k1 разделено на два этапа: сначала посредством предварительного обучения получается базовая модель, а затем на этой основе осуществляется постобучение посредством обучения с подкреплением. Базовая модель получила отличную оценку 903 на OCRBench и показала отличные результаты в тестах MathVista-testmini, MMMU-val и DocVQA. Обучение после подкрепления оптимизировано с точки зрения качества данных и эффективности обучения, что позволяет достичь новых масштабов.

Кими также независимо разработал стандартизированный набор тестов Science Vista, охватывающий математические, физические и химические вопросы различной сложности, и он будет открыт для всей отрасли. Хотя модель k1 показала некоторые ограничения во внутренних тестах, такие как возможность улучшения обобщения вне распределения и уровень успеха при решении сложных задач, ее производительность в сценах с визуальным шумом лучше, чем у других моделей, демонстрируя сверхсильную способность визуального распознавания.

Модель визуального мышления k1 интеллектуального помощника Кими не только хорошо работает в области математики, но также распространяется на области физики и химии, демонстрируя широкий спектр основных научных возможностей. Кроме того, модель k1 продемонстрировала общую способность объяснять и рассуждать о нематематических проблемах, таких как содержание и предыстория рукописи ученого.

Kimi Smart Assistant с нетерпением ждет возможности исследовать большой мир вместе с пользователями. Выпущена новая модель k1. Пользователи могут испытать эту новую функцию через последнюю версию мобильного приложения Kimi Smart Assistant или веб-версию.

Модель Кими k1 хорошо показала себя во многих тестах производительности, продемонстрировав свои сильные способности к визуальному мышлению и широкие перспективы применения. Хотя еще есть области для улучшения, прорывы в распознавании изображений и научных ответах на вопросы, несомненно, придадут новый импульс развитию области искусственного интеллекта. Пользователи могут испытать новые интерактивные возможности модели k1!