La empresa de inteligencia artificial de Hangzhou, DeepSeek, lanzó su último modelo de lenguaje a gran escala V3, que logra un rendimiento similar al GPT-4 de OpenAI y al Claude 3.5Sonnet de Anthropic a un bajo costo ($5,6 millones), atrayendo la atención de la industria. Este logro destaca las sólidas capacidades de investigación e ingeniería de DeepSeek con recursos limitados y también proporciona nuevas ideas para la investigación y el desarrollo de modelos de lenguaje a gran escala, desafiando el concepto tradicional de que una alta inversión puede lograr altos rendimientos. El éxito del modelo V3 puede indicar más posibilidades de desarrollo futuro en el campo de la IA.
Recientemente, DeepSeek, una empresa de inteligencia artificial ubicada en Hangzhou, lanzó su último modelo de lenguaje a gran escala: V3. El rendimiento de este modelo de código abierto en múltiples pruebas comparativas es cercano al de OpenAI 4o y Claude3.5Sonnet de Anthropic, que ha impresionado a la industria. En comparación con los cientos de millones de dólares invertidos por sus homólogos estadounidenses, el coste total del modelo V3 de DeepSeek es de sólo 5,6 millones de dólares estadounidenses. Esta enorme diferencia llama la atención.
Liang Wenfeng, director ejecutivo de DeepSeek, dijo que la financiación nunca ha sido un problema para ellos. Aunque V3 está capacitado en base al chip H800, el equipo de DeepSeek aún puede demostrar sólidas capacidades de investigación e ingeniería a pesar de los recursos limitados.
Andrej Karpathy, un pionero en el campo de la IA, comentó que el presupuesto de inversión de DeepSeek era "qué broma", pero el resultado final fue "una investigación e ingeniería muy impresionantes con limitaciones de recursos".
La AGI se considera el "Santo Grial" de la investigación de la IA, capaz de superar a los humanos en la resolución de problemas y la realización de tareas. Los expertos pertinentes predicen que una vez que la tecnología madure, el primer país que implemente la AGI tendrá enormes ventajas económicas, científicas y de seguridad.
El éxito del modelo DeepSeek V3 no sólo demuestra que se pueden lograr avances revolucionarios a bajo costo, sino que, lo que es más importante, proporciona una nueva perspectiva y dirección para la investigación y el desarrollo de la IA a nivel mundial, y también brinda oportunidades para que los países en desarrollo se pongan al día con las tecnologías avanzadas. Los niveles en el campo de la inteligencia artificial ganaron esperanza. En el futuro, es posible que se produzcan más "milagros" similares.