Shanghai Step Reasoner Intelligent Technology Co., Ltd. a officiellement lancé son modèle de raisonnement auto-développé Step Reasoner mini (Step R-mini) le 16 janvier 2025. Ce modèle est le premier modèle d'inférence de la série Step. Les utilisateurs peuvent découvrir ses puissantes capacités d'inférence via la page Web Yuewen. Step R-mini fonctionne bien dans de nombreux domaines tels que le raisonnement logique, le codage, les mathématiques et la création littéraire. Ses performances dans plusieurs tests de référence dépassent même celles de certains modèles concurrents. Le point fort de ce modèle est sa capacité à combiner les compétences en arts libéraux et en sciences, ce qui est rare parmi des modèles similaires.
Le 16 janvier 2025, Shanghai Step Reasoner Intelligent Technology Co., Ltd. a annoncé que son modèle de raisonnement auto-développé Step Reasoner mini (« Step R-mini ») avait été officiellement lancé. Les utilisateurs peuvent se connecter à la page Web de Yuewen https://yuewen.cn et sélectionner « Step R-mini » dans le coin supérieur gauche pour en faire l'expérience.
Step R-mini est le premier modèle de raisonnement de la famille de modèles de la série Step. Il est efficace en matière de planification, d'essai et de réflexion proactive, et fournit aux utilisateurs des réponses précises et fiables grâce au mécanisme logique de réflexion lente et de vérification répétée. Il peut non seulement résoudre des problèmes complexes tels que le raisonnement logique, le codage et les mathématiques grâce à des capacités de raisonnement ultra-longues, mais également prendre en compte des domaines généraux tels que la création littéraire.
La matrice de modèles de base de la série Step, développée indépendamment par Step Star, couvre des fonctionnalités complètes allant du langage à la multimodalité jusqu'au raisonnement. Dans les tests de référence mathématiques tels que AIME et Math, les performances de Step R-mini dépassent o1-preview et sont comparables à celles d'OpenAI o1-mini. Il fonctionne également mieux que o1-preview sur les tâches de code LiveCodeBench. Il convient de mentionner que la plupart des modèles d'inférence ne peuvent pas prendre en compte à la fois les arts et les sciences, mais Step R-mini réalise « à la fois les arts et les sciences » grâce à une formation d'apprentissage par renforcement à grande échelle et à l'utilisation d'algorithmes d'apprentissage par renforcement On-Policy », il. peut non seulement répondre avec précision aux questions de mathématiques, de codage et de raisonnement logique, mais également réaliser de manière créative la création de contenu littéraire et les tâches de discussion quotidiennes.
Dans les applications pratiques, Step R-mini montre d'excellents résultats. Lors de la résolution de problèmes mathématiques, face aux problèmes de l'Olympiade mathématique, il peut construire une chaîne de raisonnement raisonnable, réaliser la planification et la solution étape par étape de problèmes mathématiques complexes et énumérer différentes solutions pour la validation croisée. Lorsque vous traitez des problèmes de géométrie, vous pouvez créer activement des supports de contenu pour une réflexion approfondie à travers l'esquisse. Dans les tâches de raisonnement logique, essayez de manière indépendante diverses idées de résolution de problèmes et posez-vous des questions pour vous assurer que toutes les bonnes solutions sont énumérées. En termes de questions de codage, vous pouvez répondre correctement aux questions d'algorithme avec un niveau de difficulté « Difficile » sur la plateforme technologique LeetCode. Vous pouvez également gérer des exigences de développement complexes, analyser progressivement les besoins et les intentions des utilisateurs et créer une logique de code. En termes de création de contenu, vous pouvez comprendre en profondeur les besoins d'expression des utilisateurs, analyser les thèmes créatifs, les thèmes littéraires et d'autres exigences, réfléchir aux angles créatifs, représenter des scènes, des techniques rhétoriques et la structure du contenu, donner aux choses une signification symbolique au niveau émotionnel humain. , et ajoutez des éléments personnalisés et innovants. En ce qui concerne les questions de traduction, nous suivons le principe « fidélité, élégance, élégance » et nous efforçons de présenter des résultats de traduction précis et significatifs.
En plus des modèles de raisonnement linguistique, Step Star construit également un modèle de raisonnement visuel pour intégrer les capacités de raisonnement dans de grands modèles avec des formes plus interactives. Visant le problème de raisonnement dans des scènes visuelles complexes, les idées de perception lente et de raisonnement spatial sont introduites pour transférer la mise à l'échelle du temps de test de l'espace texte à l'espace visuel afin de réaliser la pensée spatiale lente dans l'espace visuel. À l'heure actuelle, le modèle de raisonnement visuel a obtenu les premiers résultats et la version officielle devrait être rendue accessible à tous cette année.
Le lancement de Step R-mini marque une avancée majeure pour Step Star dans le domaine de l'intelligence artificielle. Ses puissantes capacités de raisonnement et son potentiel d'application multi-domaines méritent d'être attendus. À l’avenir, nous continuerons à prêter attention au développement ultérieur de Step Star dans le domaine de l’intelligence artificielle.