Downcodes의 편집자는 중국 사모펀드 거대 Magic Square Quantitative의 자회사인 DeepSeek가 최근 최신 추론 중심 대규모 언어 모델 R1-Lite-Preview를 출시했다는 사실을 알게 되었습니다. 이 모델은 현재 DeepSeek Chat 웹 챗봇 플랫폼을 통해서만 대중에게 공개되고 있으며, 그 성능은 OpenAI가 최근 공개한 o1-preview 모델에 근접하거나 뛰어넘을 정도로 큰 관심을 받고 있습니다. DeepSeek은 오픈 소스 AI 생태계에 기여한 것으로 잘 알려져 있으며, 이번 출시로 접근성과 투명성에 대한 약속이 이어졌습니다.
중국의 거대 사모펀드 Huifang Quantitative의 자회사인 DeepSeek는 최근 최신 추론 중심 대규모 언어 모델 R1-Lite-Preview를 출시했습니다. 이 모델은 현재 웹 챗봇 플랫폼인 DeepSeek Chat을 통해서만 대중에게 공개됩니다.
DeepSeek은 오픈 소스 AI 생태계에 대한 혁신적인 기여로 잘 알려져 있으며, 이번 새 릴리스는 접근성과 투명성에 대한 약속을 유지하면서 대중에게 높은 수준의 추론 기능을 제공하는 것을 목표로 합니다. R1-Lite-Preview는 현재 채팅 애플리케이션에서만 사용할 수 있지만 OpenAI가 최근 출시한 o1-preview 모델에 가깝거나 심지어 이를 능가하는 성능으로 광범위한 관심을 끌고 있습니다.
R1-Lite-Preview는 사용자 쿼리에 응답할 때 거치는 다양한 사고 과정을 보여줄 수 있는 "체인 사고" 추론을 사용합니다.
일부 사고 사슬은 인간에게 무의미하거나 잘못된 것처럼 보일 수 있지만 전반적으로 R1-Lite-Preview의 답변은 매우 정확하며 GPT-4o 및 Claude 시리즈와 같은 일부 기존의 강력한 AI 모델이 직면한 "함정"을 해결할 수도 있습니다.” 예를 들어 "딸기"라는 단어에는 R이 몇 개 있나요? "9.11과 9.9 중 어느 것이 더 큽니까?"
DeepSeek에 따르면 이 모델은 논리적 추론, 수학적 사고 및 실시간 문제 해결이 필요한 작업에 탁월합니다. AIME(American Invitational Mathematics Examination), MATH 등 확립된 벤치마크에서 OpenAI o1-preview 수준을 능가하는 성능을 보여줍니다.
또한 DeepSeek은 모델에 대한 확장된 데이터를 공개하여 문제 해결을 위해 모델에 더 많은 시간, 즉 "생각 토큰"이 주어졌을 때 정확도가 꾸준히 향상되는 것을 보여주었습니다. 차트는 사고의 깊이가 높아질수록 AIME와 같은 벤치마크에서 모델 점수가 향상된다는 점을 강조합니다.
R1-Lite-Preview의 현재 릴리스는 GPQA 및 Codeforces와 같은 최고의 추론 모델과 비슷한 점수로 복잡한 수학부터 논리 시나리오까지 다양한 작업을 처리할 수 있는 주요 벤치마크에서 좋은 성능을 발휘합니다. 모델의 투명한 추론 프로세스를 통해 사용자는 논리적 단계를 실시간으로 관찰할 수 있어 시스템의 책임감과 신뢰성이 향상됩니다.
DeepSeek은 타사의 독립적인 분석 또는 벤치마킹을 위한 완전한 코드를 공개하지 않았으며 독립적인 테스트를 위한 API 인터페이스도 제공하지 않았다는 점은 주목할 가치가 있습니다. 회사는 아직 관련 블로그 게시물이나 교육 또는 테스트를 설명하는 기술 문서를 게시하지 않았습니다. R1-Lite-Preview. 그 뒤에 있는 기원은 여전히 의구심으로 가득 차 있습니다.
R1-Lite-Preview는 현재 DeepSeek Chat(chat.deepseek.com)을 통해 무료로 제공되지만 고급 "깊은 생각" 모드는 하루 50개의 메시지로 제한되어 사용자가 강력한 기능을 경험할 수 있습니다. DeepSeek은 오픈소스 AI 커뮤니티의 개발을 더욱 지원하기 위해 R1 시리즈 모델 및 관련 API의 오픈소스 버전을 출시할 계획입니다.
DeepSeek은 오픈 소스 AI 공간에서 지속적으로 혁신을 주도하고 있으며 R1-Lite-Preview의 출시로 추론 및 확장성에 새로운 차원이 추가되었습니다. 기업과 연구자들이 추론 집약적인 AI 응용 프로그램을 탐색함에 따라 DeepSeek의 개방성에 대한 헌신은 해당 모델이 개발 및 혁신을 위한 중요한 리소스가 되도록 보장할 것입니다.
공식입장 : https://www.deepseek.com/
전체적으로 R1-Lite-Preview는 대규모 언어 모델 분야에서 DeepSeek의 강력한 강점을 보여주며 오픈 소스 계획도 기대할 가치가 있습니다. 그러나 코드 및 기술 문서가 공개되지 않아 기술 세부 사항에 대한 미스터리도 발생합니다. Downcodes의 편집자는 DeepSeek의 후속 진행 상황에 계속해서 주의를 기울일 것입니다.