La startup china Deepseek ha aumentado rápidamente con su modelo de lenguaje a gran escala de IA generativo de alto rendimiento y bajo costo (LLM), lo que atrae la atención global. Su fortaleza técnica ha sido reconocida por expertos internacionalmente autorizados y se cree que supera a los Estados Unidos de alguna manera. Este artículo proporcionará una interpretación en profundidad de la evaluación de Deepseek de Deepseek y el impacto de Deepseek en el panorama global de IA, y exploró la importancia de su estrategia de código abierto y los riesgos de seguridad de los modelos de IA.
El modelo de lenguaje a gran escala de IA generativo de alto rendimiento y bajo costo desarrollado por la startup china Deepseek (Deep Search) ha atraído recientemente la atención global. En una entrevista con Nikkei Shin-Chi, un campo autoritario de investigación de IA japonés y profesor en la Universidad de Tokio, Matsuo, realizó un análisis en profundidad del nivel técnico de Deepseek, la estrategia de código abierto y su impacto en las empresas japonesas.
Matsuo Toyo dijo que la tecnología de Deepseek es excelente y que su rendimiento está cerca de ChatGPT desarrollado por Operai en los Estados Unidos. Señaló que Deepseek libera documentos técnicos detallados cada vez que lanza un nuevo modelo, que muestra sus innovaciones en la optimización del modelo. Por ejemplo, el último modelo "R1" publicado en enero de este año ha mejorado su capacidad de inferencia a través del aprendizaje de refuerzo, alcanzando un nivel comparable al modelo "O1" de OpenAI.
Matsuo Tung cree que el nivel de desarrollo de AI de China ya es comparable al de los Estados Unidos, e incluso supera a los Estados Unidos en algunos aspectos. Señaló que China no solo tiene gigantes tecnológicos como Alibaba, Tencent y Baidu, sino que también tiene una gran cantidad de ingenieros sobresalientes para formar un ecosistema de IA activo. No es sorprendente que Deepseek aumente en ese entorno y pueda cambiar aún más el panorama de poder de la competencia global de IA.
Matsuo Feng enfatizó que el éxito de Deepseek ha proporcionado una inspiración importante para las nuevas empresas japonesas. Como empresa de tecnología no grande, Deepseek ha logrado una precisión líder en el mundo con un sólido desarrollo tecnológico. Esto muestra que incluso en Japón, mientras las empresas se centren en la innovación tecnológica, también tienen la oportunidad de hacer avances en el campo de la IA.
Deepseek adopta una estrategia de código abierto, que es similar a compañías como Meta y Alibaba. Matsuo Tsubasa señala que el modelo de código abierto proporciona una base sólida para los desarrolladores globales, lo que facilita el aprendizaje y las mejoras de rendimiento adicionales. Él cree que la aparición de Deepseek ha mejorado la influencia del poder de código abierto.
Con respecto a los riesgos de seguridad de los modelos de IA, Matsuo Toyo dijo que los riesgos varían según la forma en que se usan. El modelo de código abierto puede ejecutarse localmente, evitando el riesgo de fuga de datos; Hizo hincapié en que si es Deepseek o OpenAI, los usuarios deben mantener la confianza en el proveedor de servicios porque el uso de datos y el aprendizaje son difíciles de excluir por completo.
El ascenso de Deepseek no solo demuestra el rápido desarrollo de la tecnología de inteligencia artificial de China, sino que también trae un nuevo panorama competitivo y la dirección de desarrollo a la industria mundial de IA. En el futuro, vale la pena esperar si Deepseek puede continuar manteniendo la innovación y mejorar aún más el rendimiento y la seguridad de sus modelos.