Se lanza el modelo grande de código abierto nacional DeepSeek R1, su rendimiento supera al modelo o1 y el costo se reduce en un 90% - artículo de AI

Autor：Eve Cole Fecha de actualización：2025-01-28 13:00:02

El modelo grande R1, de código abierto por el equipo chino DeepSeek, ha mostrado ventajas impresionantes en términos de rendimiento y costo, atrayendo una amplia atención de la comunidad tecnológica global. Ha superado al modelo o1 de OpenAI en muchas pruebas autorizadas, especialmente en los campos de las matemáticas y la programación. Destaca por su ventaja de coste extremadamente bajo y se ha convertido en un caballo oscuro en el campo de los grandes modelos de código abierto. El código abierto de R1 no sólo demuestra el avance de China en el campo de la tecnología de modelos grandes, sino que también inyecta nueva vitalidad al desarrollo global de la IA.

Texto: Recientemente, el equipo chino DeepSeek lanzó su último modelo grande de código abierto, R1, que ha atraído una amplia atención. El rendimiento del modelo R1 es extremadamente bueno, superando al modelo o1 de OpenAI en muchas pruebas, especialmente en evaluaciones de matemáticas y programación.

En la última prueba estadounidense AIME2024, R1 obtuvo 79,8 puntos, superando los 79,2 puntos de o1. En la prueba MATH-500, R1 obtuvo 97,3 puntos, también por delante de los 96,4 puntos de o1. Además, en la prueba SWE-bench Verified, R1 obtuvo una puntuación de 49,2, que también superó la puntuación de 48,9 de o1. Aunque en la prueba de código Codeforces, R1 es solo 0,3 puntos inferior a o1, el rendimiento general es equivalente al del modelo o1.

Además del rendimiento, la ventaja de costes del R1 es aún más llamativa. El modelo o1 de OpenAI tiene una tarifa de entrada de hasta 15 dólares estadounidenses por millón de tokens, mientras que el costo de R1 es de solo 0,14 dólares estadounidenses, una reducción de costos del 90%. En términos de producción, la tarifa de o1 es de 60 dólares estadounidenses por millón de tokens, mientras que R1 solo cuesta 2,19 dólares estadounidenses, una reducción de 27 veces. Esta enorme diferencia de costo hace que R1 se destaque en el campo de los modelos grandes de código abierto.

Después de que el equipo de DeepSeek anunció que R1 era de código abierto, muchos internautas extranjeros expresaron su admiración por este modelo, creyendo que R1 superó las plataformas de código abierto establecidas como Meta y Mistral en términos de costos y rendimiento. Mucha gente dice que las capacidades de razonamiento eficiente del modelo R1 lo hacen excelente en la escritura de códigos y explicaciones matemáticas. Algunos usuarios incluso lo llaman "el modelo que más se parece al monólogo interno humano". Al mismo tiempo, el investigador de aprendizaje automático de Apple, Awni Hannun, también probó R1 y descubrió que se ejecuta rápidamente y tiene una alta eficiencia de inferencia en Apple M2Ultra.

El desarrollo del modelo R1 pasó por un proceso de entrenamiento de múltiples etapas, que incluyó datos de arranque en frío y entrenamiento de múltiples etapas para mejorar sus capacidades de inferencia y legibilidad. Estas mejoras técnicas garantizan el rendimiento superior del modelo R1 en una variedad de tareas.

Con el lanzamiento de R1, el gran modelo de código abierto de China ha vuelto a atraer gran atención y discusión en el mercado internacional, y muchos entusiastas de la tecnología han expresado expectativas sobre el potencial de este modelo. El lanzamiento de R1 marca un nuevo avance de China en el campo de la tecnología de modelos grandes y promueve el desarrollo de tecnología de código abierto.

Dirección de código abierto: https://huggingface.co/deepseek-ai/R1

API: https://api-docs.deepseek.com/guides/reasoning_model

Destacar:

El modelo R1 superó al o1 de OpenAI en múltiples pruebas y mostró un rendimiento excelente.

Los costos de entrada y salida de R1 son tan bajos como $0,14 y $2,19 respectivamente, una reducción de costos del 90%.

R1 ha recibido una amplia atención desde que fue de código abierto. Muchos expertos extranjeros elogiaron su desempeño y consideraron que es extremadamente rentable.

La aparición de R1 no solo proporciona a los desarrolladores una herramienta poderosa con alto rendimiento y bajo costo, sino que también presagia la continua innovación y mejora de la competitividad de China en el campo de la inteligencia artificial. Esperamos que R1 aporte avances a más campos en el futuro.

​Se lanza el modelo grande de código abierto nacional DeepSeek R1, su rendimiento supera al modelo o1 y el costo se reduce en un 90% - artículo de AI

Se lanza el modelo grande de código abierto nacional DeepSeek R1, su rendimiento supera al modelo o1 y el costo se reduce en un 90% - artículo de AI