DeepSeek, société d'IA de Hangzhou, a publié son dernier modèle de langage à grande échelle V3, qui atteint des performances similaires à celles du GPT-4 d'OpenAI et du Claude 3.5Sonnet d'Anthropic à faible coût (5,6 millions de dollars), attirant l'attention de l'industrie. Cette réalisation met en évidence les solides capacités de recherche et d'ingénierie de DeepSeek avec des ressources limitées, et fournit également de nouvelles idées pour la recherche et le développement de modèles de langage à grande échelle, remettant en question le concept traditionnel selon lequel un investissement élevé peut générer des rendements élevés. Le succès du modèle V3 peut indiquer davantage de possibilités de développement futur dans le domaine de l'IA.
Récemment, DeepSeek, une société d'IA située à Hangzhou, a publié son dernier modèle de langage à grande échelle V3. Les performances de ce modèle open source dans de multiples tests de référence sont proches de celles de 4o d'OpenAI et de Claude3.5Sonnet d'Anthropic, ce qui a impressionné l'industrie. Comparé aux centaines de millions de dollars investis par ses homologues américains, le coût total du modèle V3 de DeepSeek n'est que de 5,6 millions de dollars. Cette énorme différence est frappante.
Liang Wenfeng, PDG de DeepSeek, a déclaré que le financement n'a jamais été un problème pour eux. Bien que la V3 soit formée sur la base de la puce H800, l'équipe DeepSeek peut toujours démontrer de solides capacités de recherche et d'ingénierie avec des ressources limitées.
Andrej Karpathy, un pionnier dans le domaine de l'IA, a déclaré que le budget d'investissement de DeepSeek était "quelle blague", mais que le résultat final était "une recherche et une ingénierie très impressionnantes dans des conditions de ressources limitées".
L'AGI est considérée comme le « Saint Graal » de la recherche sur l'IA, capable de surpasser les humains dans la résolution de problèmes et l'exécution de tâches. Les experts concernés prédisent qu'une fois la technologie arrivée à maturité, le premier pays à mettre en œuvre l'AGI bénéficiera d'énormes avantages économiques, scientifiques et en matière de sécurité.
Le succès du modèle DeepSeek V3 prouve non seulement que des progrès révolutionnaires peuvent être réalisés à faible coût, mais, plus important encore, il offre une nouvelle perspective et une nouvelle orientation à la recherche et au développement mondiaux en matière d'IA, et apporte également des avantages aux pays en développement pour rattraper leur retard. niveaux dans le domaine de l’intelligence artificielle ont repris espoir. À l’avenir, d’autres « miracles » similaires pourraient se produire.