DeepSeek, uma subsidiária da gigante chinesa de investimentos quantitativos Huifang Quantitative, lançou recentemente seu mais recente modelo de linguagem em grande escala com foco em inferência, R1-Lite-Preview. Este modelo está atualmente disponível apenas ao público por meio da plataforma de chatbot da web DeepSeek Chat. R1-Lite-Preview usa raciocínio de "pensamento em cadeia", que pode mostrar o processo de pensamento pelo qual ele passa ao responder às perguntas dos usuários. Mesmo que algumas cadeias de pensamento pareçam absurdas, sua precisão geral de resposta é muito alta e pode até resolver alguns problemas tradicionais. . Problemas que são difíceis de serem resolvidos por modelos de IA poderosos. O modelo superou o modelo o1-preview lançado recentemente da OpenAI em vários testes de benchmark e seu desempenho é excelente em tarefas que exigem raciocínio lógico, pensamento matemático e resolução de problemas em tempo real.
DeepSeek é conhecido por suas contribuições inovadoras para o ecossistema de IA de código aberto, e esta nova versão visa trazer recursos de inferência de alto nível ao público, mantendo ao mesmo tempo o compromisso com a acessibilidade e a transparência. Embora R1-Lite-Preview esteja atualmente disponível apenas em aplicativos de bate-papo, ele atraiu muita atenção com desempenho próximo ou até mesmo superior ao modelo o1-preview lançado recentemente da OpenAI. R1-Lite-Preview usa o raciocínio de “pensamento em cadeia”, que pode mostrar os diferentes processos de pensamento pelos quais passa ao responder às perguntas dos usuários.
Embora algumas cadeias de pensamento possam parecer absurdas ou erradas para os humanos, no geral, as respostas do R1-Lite-Preview são muito precisas e podem até resolver as "armadilhas" encontradas por alguns modelos tradicionais de IA poderosos, como GPT-4o e série Claude "Perguntas, como quantos R há na palavra "morango" "Qual é maior, 9,11 ou 9,9?"
Segundo DeepSeek, o modelo se destaca em tarefas que exigem raciocínio lógico, pensamento matemático e resolução de problemas em tempo real. Seu desempenho excede o nível de pré-visualização OpenAI o1 em benchmarks estabelecidos como AIME (American Invitational Mathematics Examination) e MATH.
Além disso, a DeepSeek divulgou dados estendidos para o modelo, demonstrando uma melhoria constante na precisão quando o modelo recebe mais tempo, ou “tokens de pensamento”, para resolver o problema. O gráfico destaca que à medida que a profundidade do pensamento aumenta, a pontuação do modelo em benchmarks como o AIME melhora.
A versão atual do R1-Lite-Preview tem um bom desempenho nos principais benchmarks, capaz de lidar com uma variedade de tarefas, desde matemática complexa até cenários lógicos, com pontuações comparáveis aos principais modelos de inferência, como GPQA e Codeforces. O processo de raciocínio transparente do modelo permite aos usuários observar seus passos lógicos em tempo real, aumentando o senso de responsabilidade e credibilidade do sistema.
É importante notar que a DeepSeek não divulgou o código completo para análise independente ou benchmarking de terceiros, nem forneceu uma interface API para testes independentes. A empresa não divulgou postagens de blog relevantes ou documentos técnicos explicando o treinamento ou teste do R1. -Estrutura Lite-Preview, o que torna a origem ainda cheia de dúvidas.
Atualmente, o R1-Lite-Preview está disponível gratuitamente via DeepSeek Chat (chat.deepseek.com), mas seu modo “profundo” avançado é limitado a 50 mensagens por dia, permitindo aos usuários experimentar seus poderosos recursos. A DeepSeek planeja lançar versões de código aberto dos modelos da série R1 e APIs relacionadas para apoiar ainda mais o desenvolvimento da comunidade de IA de código aberto.
DeepSeek continua a impulsionar a inovação no espaço de IA de código aberto, e o lançamento do R1-Lite-Preview adiciona uma nova dimensão à sua inferência e escalabilidade. À medida que empresas e investigadores exploram aplicações para IA com utilização intensiva de inferências, o compromisso da DeepSeek com a abertura garantirá que os seus modelos se tornem um recurso importante para o desenvolvimento e a inovação.
Entrada oficial: https://www.deepseek.com/
Destaque:
DeepSeek lança modelo R1-Lite-Preview, cujo desempenho se aproxima e supera OpenAI o1.
O modelo apresenta um processo de raciocínio transparente e os usuários podem observar as etapas lógicas em tempo real.
Possui notáveis capacidades de aprendizado profundo e raciocínio lógico, e uma versão de código aberto e API serão lançadas no futuro.
Em suma, o modelo R1-Lite-Preview lançado pela DeepSeek mostra vantagens significativas em recursos de inferência, e também vale a pena esperar por seu processo de inferência transparente e planos futuros de código aberto. No entanto, a atual falta de código público e de documentação técnica limita uma avaliação abrangente do seu desempenho.