Le dernier modèle de raisonnement Marco-O1 publié par Alibaba International IA a montré un potentiel important dans la résolution des problèmes ouverts. Il franchit les limites des modèles traditionnels limités au domaine des réponses standard et s'engage à explorer des applications dans des domaines difficiles à quantifier et au manque de récompenses claires. La caractéristique principale de ce modèle est sa méthode de formation unique pour concilier les stratégies d'expansion de l'espace afin qu'elle puisse gérer des tâches plus compliquées et plus difficiles, telles que des traductions longues et difficiles, et montrer des capacités de raisonnement solides. L'open source de Marco-O1 fournit également des ressources précieuses pour la communauté de recherche sur l'IA.
L'équipe Alibaba International AI a récemment publié un nouveau type de modèle de raisonnement appelé Marco-O1. L'équipe de recherche s'engage à explorer si ces modèles peuvent être promus efficacement dans des domaines difficiles à quantifier et au manque de récompenses claires.
Les caractéristiques du modèle MARCO-O1 incluent l'utilisation de données de COT ultra-longues pour un réglage fin, en utilisant MCTS pour étendre l'espace et l'expansion de l'espace à grains fins. Le modèle construit un certain nombre de données de COT ultra-longues avec des capacités de réflexion et de correction via l'auto-play + MCTS, et est formé en combinaison avec d'autres données open source. De plus, l'équipe de recherche définit également le mini-pas pour étendre davantage l'espace de solution du modèle et guider la sortie du modèle pour sortir de meilleures réponses.
Dans la mission de traduction, le modèle Marco-O1 a montré sa capacité à gérer la traduction de difficulté. L'équipe de recherche est open source pour certaines données COT et le meilleur modèle actuellement, et prévoit d'open source plus de données et de modèles à l'avenir.
Le modèle réfléchira en réponse à un raisonnement pendant le raisonnement. Dans le domaine de la traduction machine, le modèle identifie correctement les difficultés par le biais de liens de raisonnement et se traduit par mot pour améliorer la précision globale de la traduction.
L'équipe de recherche a également essayé dans d'autres domaines de prouver que le modèle a la capacité de résoudre d'autres problèmes de réalité générale. La structure globale de Marco-O1 a construit un certain nombre de données de COT ultra-longues avec des capacités de réflexion et de correction via l'auto-play + MCTS, et formé avec d'autres données open source. L'équipe de recherche a également incorporé certaines instructions de la famille Marcopolo pour suivre l'ensemble de données afin d'améliorer les instructions du modèle pour suivre la capacité.
En termes d'utilisation, l'équipe de recherche fournit du code de raisonnement et du code de tréptation fine. De plus, ce modèle peut également fonctionner directement sur la version GGUF sur Modelcope, offrant une expérience plus rapide.
La sortie du modèle Marco-O1 marque une étape importante dans l'équipe Alibaba International AI dans le domaine des modèles de raisonnement, fournissant de nouvelles idées et outils pour résoudre des problèmes ouverts.
Modelcope:
https://modelscope.cn/Models/aidc- Ai / Marco-E1
ArXiv:
https://arxiv.org/abs/2411.14405
Github:
https://github.com/aidc- ai / marco-e1
Visage étreint:
https://huggingface.co/aidc-jarco- o1
Dans l'ensemble, l'open source du modèle Marco-O1 apporte de nouvelles possibilités à la recherche et à l'application de l'IA, et sa percée dans les problèmes ouverts mérite d'être attendue. Les liens connexes sont pratiques pour les utilisateurs pour comprendre et utiliser ce modèle davantage.