DeepSeek, una subsidiaria del gigante chino de inversión cuantitativa Huifang Quantitative, lanzó recientemente su último modelo de lenguaje a gran escala centrado en la inferencia, R1-Lite-Preview. Actualmente, este modelo solo está disponible para el público a través de la plataforma de chatbot web DeepSeek Chat. R1-Lite-Preview utiliza el razonamiento de "pensamiento en cadena", que puede mostrar el proceso de pensamiento por el que pasa al responder las consultas de los usuarios. Incluso si algunas cadenas de pensamiento parecen sin sentido, su precisión general de respuesta es muy alta e incluso puede resolver algunos problemas tradicionales. Problemas que son difíciles de manejar para los modelos de IA potentes. El modelo superó al modelo o1-preview lanzado recientemente por OpenAI en múltiples pruebas comparativas, y su rendimiento es excelente en tareas que requieren razonamiento lógico, pensamiento matemático y resolución de problemas en tiempo real.
DeepSeek es conocido por sus contribuciones innovadoras al ecosistema de IA de código abierto, y esta nueva versión tiene como objetivo brindar al público capacidades de inferencia de alto nivel manteniendo al mismo tiempo un compromiso con la accesibilidad y la transparencia. Aunque R1-Lite-Preview actualmente solo está disponible en aplicaciones de chat, ha atraído mucha atención con un rendimiento cercano o incluso superior al modelo o1-preview lanzado recientemente por OpenAI. R1-Lite-Preview utiliza el razonamiento de "pensamiento en cadena", que puede mostrar los diferentes procesos de pensamiento por los que pasa al responder a las consultas de los usuarios.
Aunque algunas cadenas de pensamiento pueden parecer absurdas o incorrectas para los humanos, en general, las respuestas de R1-Lite-Preview son muy precisas e incluso pueden resolver las "trampas" encontradas por algunos modelos tradicionales de IA potentes, como las series GPT-4o y Claude. por ejemplo, ¿cuántas R hay en la palabra "fresa"? "¿Cuál es más grande, 9,11 o 9,9?"
Según DeepSeek, el modelo destaca en tareas que requieren razonamiento lógico, pensamiento matemático y resolución de problemas en tiempo real. Su rendimiento supera el nivel de OpenAI o1-preview en puntos de referencia establecidos como AIME (American Invitational Mathematics Examination) y MATH.
Además, DeepSeek publicó datos ampliados para el modelo, lo que demuestra una mejora constante en la precisión cuando al modelo se le da más tiempo, o "tokens de pensamiento", para resolver el problema. El gráfico destaca que a medida que aumenta la profundidad del pensamiento, mejora la puntuación del modelo en puntos de referencia como AIME.
La versión actual de R1-Lite-Preview funciona bien en puntos de referencia clave, capaz de manejar una variedad de tareas, desde matemáticas complejas hasta escenarios lógicos, con puntuaciones comparables a los mejores modelos de inferencia como GPQA y Codeforces. El proceso de razonamiento transparente del modelo permite a los usuarios observar sus pasos lógicos en tiempo real, mejorando el sentido de responsabilidad y credibilidad del sistema.
Vale la pena señalar que DeepSeek no ha publicado el código completo para análisis o evaluaciones comparativas independientes de terceros, ni ha proporcionado una interfaz API para pruebas independientes. La compañía no ha publicado publicaciones de blog ni documentos técnicos relevantes que expliquen la capacitación o las pruebas de R1. -Estructura Lite-Preview, lo que hace que el origen detrás de ella aún esté lleno de dudas.
R1-Lite-Preview está actualmente disponible de forma gratuita a través de DeepSeek Chat (chat.deepseek.com), pero su modo avanzado "profundo" está limitado a 50 mensajes por día, lo que permite a los usuarios experimentar sus poderosas capacidades. DeepSeek planea lanzar versiones de código abierto de los modelos de la serie R1 y API relacionadas para respaldar aún más el desarrollo de la comunidad de IA de código abierto.
DeepSeek continúa impulsando la innovación en el espacio de la IA de código abierto y el lanzamiento de R1-Lite-Preview agrega una nueva dimensión a su inferencia y escalabilidad. A medida que las empresas y los investigadores exploran aplicaciones para la IA con uso intensivo de inferencias, el compromiso de DeepSeek con la apertura garantizará que sus modelos se conviertan en un recurso importante para el desarrollo y la innovación.
Entrada oficial: https://www.deepseek.com/
Destacar:
DeepSeek lanza el modelo R1-Lite-Preview, cuyo rendimiento se acerca y supera a OpenAI o1.
El modelo muestra un proceso de razonamiento transparente y los usuarios pueden observar los pasos lógicos en tiempo real.
Tiene notables capacidades de aprendizaje profundo y razonamiento lógico, y en el futuro se lanzará una versión de código abierto y una API.
Con todo, el modelo R1-Lite-Preview lanzado por DeepSeek muestra ventajas significativas en las capacidades de inferencia, y también vale la pena esperar su proceso de inferencia transparente y sus futuros planes de código abierto. Sin embargo, la falta actual de código público y documentación técnica limita una evaluación integral de su desempeño.