A startup chinesa Deepseek aumentou rapidamente com seu modelo de idioma em larga escala (LLM), de alto desempenho e baixo custo, atraindo atenção global. Sua força técnica foi reconhecida por especialistas em autoridade internacional e acredita -se que supere os Estados Unidos de certa forma. Este artigo fornecerá uma interpretação aprofundada da avaliação de Deepseek de Deepseek e o impacto da Deepseek no cenário global da IA e explorará o significado de sua estratégia de código aberto e os riscos de segurança dos modelos de IA.
O modelo de idioma em larga escala de larga escala (LLM), de alto desempenho e de baixo custo, desenvolvido pela startseek chinesa Deepseek (Deep Search) recentemente atraiu a atenção global. Em uma entrevista à Nikkei Shin-Chi, um campo de pesquisa de IA japonês autoritário e professor da Universidade de Tóquio, Matsuo, conduziu uma análise aprofundada da estratégia técnica da Deepseek, a estratégia de código aberto e seu impacto nas empresas japonesas.
Matsuo Toyo disse que a tecnologia da Deepseek é excelente e seu desempenho está próximo do ChatGPT desenvolvido pelo Openai nos Estados Unidos. Ele ressaltou que a Deepseek lança documentos técnicos detalhados toda vez que libera um novo modelo, mostrando suas inovações na otimização do modelo. Por exemplo, o modelo mais recente "R1" lançado em janeiro deste ano melhorou sua capacidade de inferência através do aprendizado de reforço, atingindo um nível comparável ao modelo "O1" OpenAI.
Matsuo Tung acredita que o nível de desenvolvimento da IA da China já é comparável ao dos Estados Unidos e até supera os Estados Unidos em alguns aspectos. Ele ressaltou que a China não apenas tem gigantes de tecnologia como Alibaba, Tencent e Baidu, mas também tem um grande número de engenheiros de destaque para formar um ecossistema de IA ativo. Não é de surpreender que a ascensão de Deepseek em tal ambiente e possa alterar ainda mais o cenário de poder da competição global da IA.
Matsuo Feng enfatizou que o sucesso de Deepseek forneceu uma inspiração importante para as startups japonesas. Como uma empresa de tecnologia não grande, a DeepSeek alcançou a precisão líder mundial com sólido desenvolvimento de tecnologia. Isso mostra que, mesmo no Japão, desde que as empresas se concentrem na inovação tecnológica, elas também têm a oportunidade de fazer avanços no campo da IA.
A Deepseek adota uma estratégia de código aberto, semelhante a empresas como Meta e Alibaba. O Matsuo Tsubasa ressalta que o modelo de código aberto fornece uma base forte para os desenvolvedores globais, facilitando as melhorias adicionais de aprendizado e desempenho. Ele acredita que o surgimento da Deepseek aumentou a influência do poder de código aberto.
Em relação aos riscos de segurança dos modelos de IA, Matsuo Toyo disse que os riscos variam de maneira como são usados. O modelo de código aberto pode ser executado localmente, evitando o risco de vazamento de dados; Ele enfatizou que se é Deepseek ou OpenAI, os usuários precisam manter a confiança no provedor de serviços, porque o uso e o aprendizado de dados são difíceis de excluir completamente.
A ascensão da Deepseek não apenas demonstra o rápido desenvolvimento da tecnologia de IA da China, mas também traz uma nova direção competitiva para o setor de IA global. No futuro, vale a pena esperar se o DeepSeek pode continuar mantendo a inovação e melhorar ainda mais o desempenho e a segurança de seus modelos.