O grande modelo doméstico de código aberto DeepSeek R1 é lançado, seu desempenho supera o modelo o1 e o custo é reduzido em 90% - artigo AI

Autor：Eve Cole Data da Última Atualização：2025-01-28 13:00:02

O grande modelo R1, de código aberto da equipe chinesa DeepSeek, mostrou vantagens impressionantes em termos de desempenho e custo, atraindo ampla atenção da comunidade tecnológica global. Ele superou o modelo o1 da OpenAI em muitos testes confiáveis, especialmente nas áreas de matemática e programação. Ele se destaca por sua vantagem de custo extremamente baixo e se tornou um azarão no campo de grandes modelos de código aberto. O código aberto do R1 não apenas demonstra o avanço da China no campo da tecnologia de grandes modelos, mas também injeta uma nova vitalidade no desenvolvimento global da IA.

Texto: Recentemente, a equipe DeepSeek da China lançou seu mais recente modelo grande de código aberto R1, que atraiu ampla atenção. O desempenho do modelo R1 é extremamente bom, superando o modelo o1 da OpenAI em muitos testes, principalmente em avaliações de matemática e programação.

No último teste americano AIME2024, R1 marcou 79,8 pontos, superando os 79,2 pontos de o1. No teste MATH-500, R1 marcou 97,3 pontos, também à frente dos 96,4 pontos de o1. Além disso, no teste SWE-bench Verified, R1 obteve pontuação de 49,2, que também excedeu a pontuação de 48,9 de o1. Embora no teste de código Codeforces, R1 seja apenas 0,3 pontos menor que o1, o desempenho geral é equivalente ao modelo o1.

Além do desempenho, a vantagem de custo do R1 é ainda mais atraente. O modelo o1 da OpenAI tem uma taxa de entrada de até US$ 15 por 1 milhão de tokens, enquanto o custo do R1 é de apenas US$ 0,14, uma redução de custo de 90%. Em termos de produção, a taxa do o1 é de US$ 60 por 1 milhão de tokens, enquanto o R1 custa apenas US$ 2,19, uma redução de 27 vezes. Essa enorme diferença de custo faz com que o R1 se destaque no campo de grandes modelos de código aberto.

Depois que a equipe DeepSeek anunciou que R1 era de código aberto, muitos internautas estrangeiros expressaram sua admiração por este modelo, acreditando que R1 superava plataformas de código aberto estabelecidas, como Meta e Mistral em termos de desempenho e custo. Muitas pessoas dizem que as capacidades de raciocínio eficiente do modelo R1 o tornam excelente na escrita de códigos e explicações matemáticas. Alguns usuários até o chamam de "o modelo que mais se assemelha ao monólogo interno humano". Ao mesmo tempo, o pesquisador de aprendizado de máquina da Apple, Awni Hannun, também testou o R1 e descobriu que ele funcionava rapidamente e tinha alta eficiência de inferência no Apple M2Ultra.

O desenvolvimento do modelo R1 passou por um processo de treinamento em vários estágios, incluindo dados de inicialização a frio e treinamento em vários estágios para melhorar suas capacidades de inferência e legibilidade. Estas melhorias técnicas garantem o desempenho superior do modelo R1 em diversas tarefas.

Com o lançamento do R1, o grande modelo de código aberto da China atraiu mais uma vez grande atenção e discussão no mercado internacional, e muitos entusiastas da tecnologia expressaram expectativas quanto ao potencial deste modelo. O lançamento do R1 marca mais um avanço da China no campo da tecnologia de modelos de grande porte e promove o desenvolvimento de tecnologia de código aberto.

Endereço de código aberto: https://huggingface.co/deepseek-ai/R1

API: https://api-docs.deepseek.com/guides/reasoning_model

Destaque:

O modelo R1 superou o o1 da OpenAI em vários testes, apresentando excelente desempenho.

Os custos de entrada e produção de R1 são tão baixos quanto US$ 0,14 e US$ 2,19, respectivamente, uma redução de custos de 90%.

O R1 recebeu ampla atenção desde que foi de código aberto. Muitos especialistas estrangeiros elogiaram seu desempenho e acreditaram que ele é extremamente econômico.

O surgimento do R1 não só fornece aos desenvolvedores uma ferramenta poderosa com alto desempenho e baixo custo, mas também anuncia a inovação contínua e a melhoria contínua da China na competitividade no campo da inteligência artificial. Esperamos que o R1 traga inovações para mais campos no futuro.