16 января 2025 года компания Shanghai Step Star Intelligent Technology Co., Ltd. официально представила собственную модель рассуждения Step Reasoner mini (Step R-mini). Эта модель является первой моделью вывода в серии Step. Пользователи могут ознакомиться с ее мощными возможностями вывода на веб-странице Yuewen. Step R-mini показывает хорошие результаты во многих областях, таких как логические рассуждения, программирование, математика и литературное творчество. Его производительность в многочисленных тестах производительности даже превосходит показатели некоторых конкурирующих моделей. Изюминкой этой модели является ее способность учитывать гуманитарные и научные компетенции, что редко встречается среди аналогичных моделей.
16 января 2025 года компания Shanghai Step Reasoner Intelligent Technology Co., Ltd. объявила об официальном запуске своей собственной модели рассуждения Step Reasoner mini («Step R-mini»). Пользователи могут войти на веб-страницу Yuewen https://yuewen.cn и выбрать «Step R-mini» в верхнем левом углу, чтобы испытать это.
Step R-mini — первая модель рассуждения в семействе моделей Step. Она хороша для упреждающего планирования, проб и размышлений и предоставляет пользователям точные и надежные ответы посредством логического механизма медленного мышления и многократной проверки. Он может не только решать сложные задачи, такие как логическое рассуждение, кодирование и математика, с помощью сверхдлинных возможностей рассуждения, но также учитывать общие области, такие как литературное творчество.
Матрица базовой модели серии Step, независимо разработанная Step Star, охватывает широкие возможности: от языка, мультимодальности до рассуждения. В математических тестах производительности, таких как AIME и Math, производительность Step R-mini превосходит o1-preview и сравнима с OpenAI o1-mini. Он также работает лучше, чем o1-preview, при выполнении задач кода LiveCodeBench. Стоит отметить, что большинство моделей вывода не могут учитывать одновременно искусство и науку, но Step R-mini достигает «и искусства, и науки» за счет крупномасштабного обучения с подкреплением и использования алгоритмов обучения с подкреплением On-Policy». может не только точно отвечать на вопросы по математике, программированию и логическому рассуждению, но также творчески выполнять создание литературного контента и ежедневные задачи в чате.
В практическом применении Step R-mini показывает отличные результаты. При решении математических задач, сталкиваясь с задачами математической олимпиады, он может построить разумную цепочку рассуждений, реализовать планирование и пошаговое решение сложных математических задач, а также перечислить различные решения для перекрестной проверки. Решая задачи геометрии, вы можете активно создавать контент для глубокого размышления посредством рисования эскизов. В задачах на логическое рассуждение самостоятельно попробуйте различные идеи решения проблем и задайте себе вопросы, чтобы убедиться, что перечислены все хорошие решения. Что касается вопросов по кодированию, вы можете правильно отвечать на вопросы алгоритма с рейтингом сложности «Сложно» на технологической платформе LeetCode. Вы также можете обрабатывать сложные требования к разработке, постепенно анализировать потребности и намерения пользователей и строить логику кода. Что касается создания контента, вы можете глубоко понимать потребности пользователей в самовыражении, анализировать творческие темы, литературные темы и другие требования, думать о творческих ракурсах, изображать сцены, риторические приемы и структуру контента, придавать вещам символическое значение на эмоциональном уровне человека. и добавьте персонализированные и инновационные элементы выразительного стиля. Когда дело касается вопросов перевода, мы следуем принципу «верность, элегантность, элегантность» и стремимся предоставлять точные и содержательные результаты перевода.
В дополнение к моделям языкового мышления Step Star также создает модель визуального мышления для интеграции возможностей рассуждения в большие модели с более интерактивными формами. Стремясь к проблеме рассуждения в сложных визуальных сценах, вводятся идеи медленного восприятия и пространственного мышления для переноса масштабирования времени тестирования из текстового пространства в визуальное пространство для реализации пространственного медленного мышления в визуальном пространстве. В настоящее время модель визуального мышления достигла первоначальных результатов, и ожидается, что официальная версия будет выпущена для всех в этом году.
Выпуск Step R-mini знаменует собой крупный прорыв для Step Star в области искусственного интеллекта. Его мощные мыслительные способности и потенциал многопрофильного применения заслуживают ожидания. В будущем мы продолжим уделять внимание дальнейшему развитию Step Star в области искусственного интеллекта.