중국 양적 투자 대기업 Huifang Quantitative의 자회사인 DeepSeek은 최근 최신 추론 중심 대규모 언어 모델 R1-Lite-Preview를 출시했습니다. 이 모델은 현재 DeepSeek Chat 웹 챗봇 플랫폼을 통해서만 대중에게 제공됩니다. R1-Lite-Preview는 "체인 사고" 추론을 사용하여 사용자 쿼리에 응답할 때 거치는 사고 프로세스를 보여줄 수 있습니다. 일부 사고 체인이 무의미해 보일지라도 전체적인 답변 정확도는 매우 높으며 일부 기존 문제도 해결할 수 있습니다. . 강력한 AI 모델이 처리하기 어려운 문제. 이 모델은 여러 벤치마크 테스트에서 최근 출시된 OpenAI의 o1-preview 모델을 능가했으며, 논리적 추론, 수학적 사고, 실시간 문제 해결이 필요한 작업에서 성능이 뛰어납니다.
DeepSeek은 오픈 소스 AI 생태계에 대한 혁신적인 기여로 잘 알려져 있으며, 이번 새 릴리스는 접근성과 투명성에 대한 약속을 유지하면서 대중에게 높은 수준의 추론 기능을 제공하는 것을 목표로 합니다. R1-Lite-Preview는 현재 채팅 애플리케이션에서만 사용할 수 있지만 OpenAI가 최근 출시한 o1-preview 모델과 비슷하거나 심지어 이를 능가하는 성능으로 많은 주목을 받았습니다. R1-Lite-Preview는 사용자 쿼리에 응답할 때 거치는 다양한 사고 과정을 보여줄 수 있는 "체인 사고" 추론을 사용합니다.
일부 사고 체인은 인간에게 무의미하거나 잘못된 것처럼 보일 수 있지만 전반적으로 R1-Lite-Preview의 답변은 매우 정확하며 GPT-4o 및 Claude 시리즈와 같은 일부 기존의 강력한 AI 모델이 직면한 "트랩"을 해결할 수도 있습니다. 예를 들어 "딸기"라는 단어에는 R이 몇 개 있나요? "9.11과 9.9 중 어느 것이 더 큽니까?"
DeepSeek에 따르면 이 모델은 논리적 추론, 수학적 사고 및 실시간 문제 해결이 필요한 작업에 탁월합니다. 성능은 AIME(American Invitational Mathematics Examination) 및 MATH와 같은 확립된 벤치마크에서 OpenAI o1-preview 수준을 능가합니다.
또한 DeepSeek은 모델에 대한 확장된 데이터를 공개하여 문제 해결을 위해 모델에 더 많은 시간, 즉 "생각 토큰"이 주어졌을 때 정확도가 꾸준히 향상되는 것을 보여주었습니다. 차트는 사고의 깊이가 높아질수록 AIME와 같은 벤치마크에서 모델 점수가 향상된다는 점을 강조합니다.
R1-Lite-Preview의 현재 릴리스는 GPQA 및 Codeforces와 같은 최고의 추론 모델과 비슷한 점수로 복잡한 수학부터 논리 시나리오까지 다양한 작업을 처리할 수 있는 주요 벤치마크에서 좋은 성능을 발휘합니다. 모델의 투명한 추론 프로세스를 통해 사용자는 논리적 단계를 실시간으로 관찰할 수 있어 시스템의 책임감과 신뢰성이 향상됩니다.
DeepSeek이 타사의 독립적인 분석 또는 벤치마킹을 위한 전체 코드를 공개하지 않았으며 독립적인 테스트를 위한 API 인터페이스도 제공하지 않았다는 점은 주목할 가치가 있습니다. 회사는 R1의 교육 또는 테스트를 설명하는 관련 블로그 게시물이나 기술 문서를 공개하지 않았습니다. -Lite-Preview. 구조는 그 뒤에 있는 기원이 여전히 의심스럽습니다.
R1-Lite-Preview는 현재 DeepSeek Chat(chat.deepseek.com)을 통해 무료로 제공되지만 고급 "심층" 모드는 하루 50개의 메시지로 제한되어 사용자가 강력한 기능을 경험할 수 있습니다. DeepSeek은 오픈소스 AI 커뮤니티의 개발을 더욱 지원하기 위해 R1 시리즈 모델 및 관련 API의 오픈소스 버전을 출시할 계획입니다.
DeepSeek은 오픈 소스 AI 공간에서 지속적으로 혁신을 주도하고 있으며 R1-Lite-Preview의 출시로 추론 및 확장성에 새로운 차원이 추가되었습니다. 기업과 연구자들이 추론 집약적인 AI 응용 프로그램을 탐색함에 따라 DeepSeek의 개방성에 대한 헌신은 해당 모델이 개발 및 혁신을 위한 중요한 리소스가 되도록 보장할 것입니다.
공식입장 : https://www.deepseek.com/
가장 밝은 부분:
DeepSeek은 OpenAI o1에 가깝거나 이를 능가하는 성능을 갖춘 R1-Lite-Preview 모델을 출시합니다.
모델은 투명한 추론 프로세스를 표시하며 사용자는 논리적 단계를 실시간으로 관찰할 수 있습니다.
뛰어난 딥러닝과 논리적 추론 능력을 갖추고 있으며, 향후 오픈소스 버전과 API도 출시될 예정입니다.
전체적으로 DeepSeek에서 출시한 R1-Lite-Preview 모델은 추론 능력 면에서 상당한 장점을 보여주고 있으며, 투명한 추론 프로세스와 향후 오픈소스 계획도 기대해볼 만하다. 그러나 현재 공개 코드 및 기술 문서가 부족하여 성능에 대한 포괄적인 평가가 제한됩니다.