DeepSeek lance son premier modèle d'inférence R1-Lite-Preview, dont les performances surpassent OpenAI o1 - Article AI

Auteur：Eve Cole Date de mise à jour：2025-01-26 02:00:01

DeepSeek, une filiale du géant chinois de l'investissement quantitatif Huifang Quantitative, a récemment publié son dernier modèle de langage à grande échelle axé sur l'inférence, R1-Lite-Preview. Ce modèle n'est actuellement disponible au public que via la plateforme de chatbot Web DeepSeek Chat. R1-Lite-Preview utilise un raisonnement de type « pensée en chaîne », qui peut montrer le processus de réflexion qu'il suit lorsqu'il répond aux requêtes des utilisateurs. Même si certaines chaînes de pensée semblent absurdes, la précision globale de sa réponse est très élevée et peut même résoudre certains problèmes traditionnels. . Des problèmes difficiles à gérer pour les modèles d’IA puissants. Le modèle a surpassé le modèle o1-preview récemment publié par OpenAI dans plusieurs tests de référence, et ses performances sont excellentes dans les tâches qui nécessitent un raisonnement logique, une pensée mathématique et une résolution de problèmes en temps réel.

DeepSeek est connu pour ses contributions innovantes à l'écosystème de l'IA open source, et cette nouvelle version vise à apporter au public des capacités d'inférence de haut niveau tout en maintenant un engagement en faveur de l'accessibilité et de la transparence. Bien que R1-Lite-Preview ne soit actuellement disponible que dans les applications de chat, il a attiré beaucoup d'attention avec des performances proches, voire supérieures, du modèle o1-preview récemment publié par OpenAI. R1-Lite-Preview utilise un raisonnement de type « pensée en chaîne », qui peut montrer les différents processus de réflexion qu'il traverse lorsqu'il répond aux requêtes des utilisateurs.

Bien que certaines chaînes de pensée puissent sembler absurdes ou fausses aux humains, dans l'ensemble, les réponses de R1-Lite-Preview sont très précises et peuvent même résoudre les « pièges » rencontrés par certains modèles d'IA puissants traditionnels tels que GPT-4o et les séries Claude « Questions ». par exemple combien de R y a-t-il dans le mot « fraise » ? « Lequel est le plus gros, 9,11 ou 9,9 ?

Selon DeepSeek, le modèle excelle dans les tâches qui nécessitent un raisonnement logique, une réflexion mathématique et une résolution de problèmes en temps réel. Ses performances dépassent le niveau d'OpenAI o1-preview sur des benchmarks établis tels que l'AIME (American Invitational Mathematics Examination) et MATH.

De plus, DeepSeek a publié des données étendues pour le modèle, démontrant une amélioration constante de la précision lorsque le modèle dispose de plus de temps, ou de « jetons de réflexion », pour résoudre le problème. Le graphique souligne qu’à mesure que la profondeur de la réflexion augmente, le score du modèle sur des critères tels que l’AIME s’améliore.

La version actuelle de R1-Lite-Preview fonctionne bien dans les tests de référence clés, capable de gérer une gamme de tâches allant des mathématiques complexes aux scénarios logiques, avec des scores comparables à ceux des meilleurs modèles d'inférence tels que GPQA et Codeforces. Le processus de raisonnement transparent du modèle permet aux utilisateurs d'observer ses étapes logiques en temps réel, renforçant ainsi le sens de responsabilité et la crédibilité du système.

Il convient de noter que DeepSeek n'a pas publié le code complet pour une analyse ou une analyse comparative indépendante par des tiers, et n'a pas non plus fourni d'interface API pour des tests indépendants. La société n'a pas publié d'articles de blog ou de documents techniques pertinents expliquant la formation ou les tests de R1. -Structure Lite-Preview, ce qui rend l'origine derrière elle encore pleine de doutes.

R1-Lite-Preview est actuellement disponible gratuitement via DeepSeek Chat (chat.deepseek.com), mais son mode avancé « profond » est limité à 50 messages par jour, permettant aux utilisateurs de découvrir ses puissantes capacités. DeepSeek prévoit de publier des versions open source des modèles de la série R1 et des API associées pour soutenir davantage le développement de la communauté open source de l'IA.

DeepSeek continue de stimuler l'innovation dans l'espace de l'IA open source, et la sortie de R1-Lite-Preview ajoute une nouvelle dimension à son inférence et à son évolutivité. Alors que les entreprises et les chercheurs explorent les applications de l'IA à forte inférence, l'engagement de DeepSeek en faveur de l'ouverture garantira que ses modèles deviendront une ressource importante pour le développement et l'innovation.

Entrée officielle : https://www.deepseek.com/

Souligner:

DeepSeek lance le modèle R1-Lite-Preview, dont les performances sont proches et supérieures à OpenAI o1.

Le modèle affiche un processus de raisonnement transparent et les utilisateurs peuvent observer les étapes logiques en temps réel.

Il possède des capacités remarquables d’apprentissage en profondeur et de raisonnement logique, et une version open source et une API seront publiées à l’avenir.

Dans l’ensemble, le modèle R1-Lite-Preview publié par DeepSeek présente des avantages significatifs en termes de capacités d’inférence, et son processus d’inférence transparent et ses futurs projets open source méritent également d’être attendus. Cependant, le manque actuel de code public et de documentation technique limite une évaluation complète de ses performances.