Recientemente, los meta ingenieros expresaron su preocupación por la compañía china de IA Deepseek y su modelo R1 en una plataforma anónima. R1 ha causado un shock de la industria con sus bajos costos de capacitación (solo $ 5.5 millones) y el rendimiento comparable al modelo O1 de OpenAI, especialmente cuando es de código abierto que supera con mucho OpenAI. Este incidente destaca el rápido aumento de China en el campo de la IA y plantea desafíos sin precedentes para los gigantes tecnológicos estadounidenses. El salario anual de meta ejecutivos incluso excede el costo de capacitación de Deepseek V3, destacando esta presión.
Por el contrario, los meta ejecutivos a menudo exceden los costos de capacitación de todo el V3 de Deepseek, lo que hace que la meta gestión se avergüence.
Según la información interna, la aparición de Deepseek V3 ha causado que Meta sienta mucha presión el año pasado. Los meta ingenieros están intensificando su tiempo para analizar la tecnología de Deepseek, con la esperanza de replicar las tecnologías clave lo antes posible. En el pasado, los investigadores de IA en todo el mundo perseguían al gran modelo de los Estados Unidos, pero ahora la situación ha cambiado, y los ingenieros estadounidenses han comenzado a revertir la tecnología de IA de China.
Deepseek no solo superó a Meta's Llama4 en las pruebas de referencia, sino que también atrajo la atención de la industria en su desempeño en múltiples campos. Deepseek logra un rendimiento de inferencia extremadamente alto a través de tecnologías como el aprendizaje de refuerzo a gran escala (RL) y el ajuste fino (SFT) sin supervisión. Esta confianza tecnológica ha provocado que algunos internautas estadounidenses comiencen a reflexionar sobre el rápido aumento de China en el campo de la IA.
Agujas:
El costo de capacitación del modelo Deepseek R1 es de solo $ 5.5 millones, y su rendimiento es comparable a la O1 de OpenAI.
Los ejecutivos de Meta superan el costo de la capacitación en Deepseek, y la gerencia está bajo una gran presión.
El éxito de Deepseek ha provocado pánico entre las empresas tecnológicas estadounidenses y desafió el dominio de los Estados Unidos en el campo de la IA.
La aparición de Deepseek R1 marca un cambio importante en el panorama global de IA, con su bajo costo, alto rendimiento y características de código abierto que tienen un gran impacto en los gigantes de IA existentes. Esto no es solo una competencia a nivel técnico, sino que también refleja la intensificación de la competencia en la industria global de IA y los cambios silenciosos en el equilibrio de poder. En el futuro, el desarrollo continuo de Deepseek merece atención continua.