Shanghai Step Star Intelligent Technology Co., Ltd. lanzó oficialmente su modelo de razonamiento de desarrollo propio Step Reasoner mini (Step R-mini) el 16 de enero de 2025. Este modelo es el primer modelo de inferencia de la serie Step. Los usuarios pueden experimentar sus poderosas capacidades de inferencia a través de la página web de Yuewen. Step R-mini funciona bien en muchos campos, como el razonamiento lógico, la codificación, las matemáticas y la creación literaria. Su rendimiento en múltiples pruebas de referencia incluso supera el de algunos modelos de la competencia. Lo más destacado de este modelo es su capacidad para tener en cuenta las competencias en artes liberales y ciencias, lo cual es poco común entre modelos similares.
El 16 de enero de 2025, Shanghai Step Reasoner Intelligent Technology Co., Ltd. anunció que se lanzó oficialmente su modelo de razonamiento de desarrollo propio Step Reasoner mini ("Step R-mini"). Los usuarios pueden iniciar sesión en la página web de Yuewen https://yuewen.cn y seleccionar "Step R-mini" en la esquina superior izquierda para experimentarlo.
Step R-mini es el primer modelo de razonamiento de la familia de modelos de la serie Step. Es bueno para la planificación, prueba y reflexión proactivas y proporciona a los usuarios respuestas precisas y confiables a través del mecanismo lógico de pensamiento lento y verificación repetida. No solo puede resolver problemas complejos como el razonamiento lógico, la codificación y las matemáticas mediante capacidades de razonamiento ultralargas, sino que también tiene en cuenta campos generales como la creación literaria.
La matriz del modelo base de la serie Step desarrollada independientemente por Step Star ha cubierto capacidades integrales desde el lenguaje, la multimodalidad hasta el razonamiento. En pruebas de referencia matemáticas como AIME y Math, el rendimiento de Step R-mini supera a o1-preview y es comparable a OpenAI o1-mini. También funciona mejor que o1-preview en tareas de código LiveCodeBench. Vale la pena mencionar que la mayoría de los modelos de inferencia no pueden tener en cuenta tanto las artes como las ciencias, pero Step R-mini logra "tanto las artes como las ciencias" a través del entrenamiento de aprendizaje por refuerzo a gran escala y el uso de algoritmos de aprendizaje por refuerzo según políticas”. No solo puede responder con precisión preguntas de matemáticas, codificación y razonamiento lógico, sino también completar creativamente la creación de contenido literario y las tareas diarias de chat.
En aplicaciones prácticas, Step R-mini muestra excelentes resultados. Al resolver problemas matemáticos, al enfrentar problemas de Olimpiada de Matemáticas, puede construir una cadena de razonamiento razonable, realizar la planificación y la solución paso a paso de problemas matemáticos complejos y enumerar diferentes soluciones para validación cruzada. Cuando se trata de problemas de geometría, puede crear activamente medios de contenido para pensar en profundidad mediante bocetos. En las tareas de razonamiento lógico, pruebe de forma independiente una variedad de ideas para la resolución de problemas y hágase preguntas para asegurarse de que se enumeren todas las buenas soluciones. En términos de preguntas de codificación, puede responder correctamente preguntas de algoritmos con una calificación de dificultad de "Difícil" en la plataforma tecnológica LeetCode. También puede manejar requisitos de desarrollo complejos, analizar gradualmente las necesidades e intenciones del usuario y crear lógica de código. En términos de creación de contenido, puede comprender profundamente las necesidades de expresión de los usuarios, analizar temas creativos, temas literarios y otros requisitos, pensar en ángulos creativos, representar escenas, técnicas retóricas y estructura de contenido, dar a las cosas un significado simbólico en el nivel emocional humano. y agregue elementos personalizados e innovadores. Cuando se trata de cuestiones de traducción, seguimos el principio de "fidelidad, elegancia, elegancia" y nos esforzamos por presentar resultados de traducción precisos y significativos.
Además de los modelos de razonamiento lingüístico, Step Star también está creando un modelo de razonamiento visual para integrar capacidades de razonamiento en modelos grandes con formas más interactivas. Con el objetivo de abordar el problema de razonamiento en escenas visuales complejas, se introducen las ideas de percepción lenta y razonamiento espacial para transferir la escala de tiempo de prueba del espacio de texto al espacio visual para realizar el pensamiento espacial lento en el espacio visual. En la actualidad, el modelo de razonamiento visual ha logrado resultados iniciales y se espera que la versión oficial se lance a todos este año.
El lanzamiento de Step R-mini marca un gran avance para Step Star en el campo de la inteligencia artificial. Vale la pena esperar sus poderosas capacidades de razonamiento y su potencial de aplicación en múltiples campos. En el futuro, seguiremos prestando atención al desarrollo de Step Star en el campo de la inteligencia artificial.