La startup chinoise Deepseek a rapidement augmenté avec son modèle de langue à grande échelle (LLM) à grande performance et à faible coût, attirant l'attention mondiale. Sa force technique a été reconnue par des experts autoritaires internationalement et devrait dépasser les États-Unis à certains égards. Cet article fournira une interprétation approfondie de l'évaluation de Deepseek de Deepseek et de l'impact de Deepseek sur le paysage mondial de l'IA, et explorera l'importance de sa stratégie open source et les risques de sécurité des modèles d'IA.
Le modèle de langage à grande échelle (LLM) développé par une AI à faible coût (LLM) développé par la startup chinoise Deepseek (Search) a récemment attiré l'attention mondiale. Dans une interview avec Nikkei Shin-Chi, un domaine de recherche japonais d'IA faisant autorité et professeur à l'Université de Tokyo, Matsuo, a effectué une analyse approfondie du niveau technique de Deepseek, de la stratégie open source et de son impact sur les entreprises japonaises.
Matsuo Toyo a déclaré que la technologie de Deepseek est excellente et que ses performances sont proches de Chatgpt développé par Openai aux États-Unis. Il a souligné que Deepseek publie des articles techniques détaillés chaque fois qu'il publie un nouveau modèle, montrant ses innovations dans l'optimisation du modèle. Par exemple, le dernier modèle "R1" publié en janvier de cette année a amélioré sa capacité d'inférence grâce à l'apprentissage du renforcement, atteignant un niveau comparable au modèle "O1" OpenAI.
Matsuo Tung estime que le niveau de développement de l'IA de la Chine est déjà comparable à celui des États-Unis et dépasse même les États-Unis à certains égards. Il a souligné que la Chine a non seulement des géants de la technologie tels que Alibaba, Tencent et Baidu, mais a également un grand nombre d'ingénieurs exceptionnels pour former un écosystème d'IA actif. Il n'est pas surprenant que la montée de Deepseek dans un tel environnement et puisse changer davantage le paysage de puissance de la concurrence mondiale de l'IA.
Matsuo Feng a souligné que le succès de Deepseek a fourni une inspiration importante aux startups japonaises. En tant qu'entreprise technologique non large, Deepseek a atteint une précision de pointe avec un développement solide de technologie. Cela montre que même au Japon, tant que les entreprises se concentrent sur l'innovation technologique, elles ont également la possibilité de faire des percées dans le domaine de l'IA.
Deepseek adopte une stratégie open source, qui est similaire à des entreprises telles que Meta et Alibaba. Matsuo Tsubasa souligne que le modèle open source fournit une base solide pour les développeurs mondiaux, facilitant l'apprentissage et les améliorations des performances supplémentaires. Il estime que l'émergence de Deepseek a amélioré l'influence du pouvoir open source.
En ce qui concerne les risques de sécurité des modèles d'IA, Matsuo Toyo a déclaré que les risques varient selon la façon dont ils sont utilisés. Le modèle open source peut s'exécuter localement, en évitant le risque de fuite de données; et lors de l'utilisation de services en ligne, les données seront envoyées au serveur pour le traitement. Il a souligné que, que ce soit Deepseek ou OpenAI, les utilisateurs doivent maintenir la confiance dans le fournisseur de services car l'utilisation des données et l'apprentissage sont difficiles à exclure complètement.
La montée en puissance de Deepseek démontre non seulement le développement rapide de la technologie de l'IA chinoise, mais apporte également une nouvelle orientation compétitive paysage et développement à l'industrie mondiale de l'IA. À l'avenir, il vaut la peine de espérer si Deepseek peut continuer à maintenir l'innovation et améliorer encore les performances et la sécurité de ses modèles.