Le grand modèle R1, open source de l'équipe chinoise DeepSeek, a montré des avantages impressionnants en termes de performances et de coût, attirant l'attention de la communauté technologique mondiale. Il a surpassé le modèle o1 d'OpenAI dans de nombreux tests faisant autorité, notamment dans les domaines des mathématiques et de la programmation. Il se distingue par son avantage en matière de coût extrêmement faible et est devenu un cheval noir dans le domaine des grands modèles open source. L'open source de R1 démontre non seulement la percée de la Chine dans le domaine de la technologie des grands modèles, mais injecte également une nouvelle vitalité dans le développement mondial de l'IA.
Texte : Récemment, l'équipe chinoise DeepSeek a lancé son dernier grand modèle open source R1, qui a attiré une large attention. Les performances du modèle R1 sont extrêmement bonnes, surpassant le modèle o1 d'OpenAI dans de nombreux tests, notamment dans les évaluations de mathématiques et de programmation.
Lors du dernier test américain AIME2024, R1 a marqué 79,8 points, dépassant les 79,2 points de o1. Dans le test MATH-500, R1 a marqué 97,3 points, également devant les 96,4 points de o1. De plus, lors du test SWE-bench Verified, R1 a obtenu un score de 49,2, qui a également dépassé le score de 48,9 de o1. Bien que dans le test de code Codeforces, R1 ne soit inférieur que de 0,3 point à o1, les performances globales sont équivalentes au modèle o1.
Outre les performances, l'avantage en termes de coût du R1 est encore plus frappant. Le modèle o1 d'OpenAI comporte des frais d'entrée allant jusqu'à 15 $ US pour 1 million de jetons, tandis que le coût du R1 n'est que de 0,14 $ US, soit une réduction des coûts de 90 %. En termes de production, les frais de o1 sont de 60 $ US pour 1 million de jetons, tandis que R1 ne coûte que 2,19 $ US, soit une réduction de 27 fois. Cette énorme différence de coût permet à R1 de se démarquer dans le domaine des grands modèles open source.
Après que l'équipe DeepSeek a annoncé que R1 était open source, de nombreux internautes étrangers ont exprimé leur admiration pour ce modèle, estimant que R1 surpassait les plates-formes open source établies telles que Meta et Mistral en termes de rapport qualité-prix et de performances. Beaucoup de gens disent que les capacités de raisonnement efficaces du modèle R1 le rendent excellent en matière d'écriture de code et d'explications mathématiques. Certains utilisateurs l'appellent même « le modèle qui ressemble le plus au monologue intérieur humain ». Dans le même temps, Awni Hannun, chercheur en apprentissage automatique chez Apple, a également testé R1 et a constaté qu'il fonctionnait rapidement et avait une efficacité d'inférence élevée sur Apple M2Ultra.
Le développement du modèle R1 est passé par un processus de formation en plusieurs étapes, comprenant des données de démarrage à froid et une formation en plusieurs étapes pour améliorer ses capacités d'inférence et sa lisibilité. Ces améliorations techniques garantissent les performances supérieures du modèle R1 dans une variété de tâches.
Avec la sortie de R1, le grand modèle open source chinois a une fois de plus attiré une grande attention et des discussions sur le marché international, et de nombreux passionnés de technologie ont exprimé leurs attentes quant au potentiel de ce modèle. La sortie de R1 marque une nouvelle percée de la Chine dans le domaine de la technologie des grands modèles et favorise le développement de la technologie open source.
Adresse open source : https://huggingface.co/deepseek-ai/R1
API : https://api-docs.deepseek.com/guides/reasoning_model
Souligner:
Le modèle R1 a surpassé le o1 d'OpenAI dans plusieurs tests, affichant d'excellentes performances.
Les coûts d'entrée et de sortie de R1 sont respectivement de 0,14 $ et 2,19 $, soit une réduction des coûts de 90 %.
R1 a reçu une large attention depuis qu'il est open source. De nombreux experts étrangers ont loué ses performances et ont estimé qu'il était extrêmement rentable.
L’émergence de R1 fournit non seulement aux développeurs un outil puissant, performant et peu coûteux, mais annonce également l’innovation continue et l’amélioration continue de la compétitivité de la Chine dans le domaine de l’intelligence artificielle. Nous attendons avec impatience que R1 apporte des percées dans davantage de domaines à l’avenir.