중국 DeepSeek 팀이 오픈소스로 공개한 대형 모델 R1은 성능과 비용 측면에서 인상적인 이점을 보여 글로벌 기술 커뮤니티의 폭넓은 관심을 끌었습니다. 특히 수학과 프로그래밍 분야에서 많은 권위 있는 테스트에서 OpenAI의 o1 모델을 능가했으며, 매우 저렴한 비용 이점으로 두각을 나타내며 오픈 소스 대형 모델 분야에서 다크호스가 되었습니다. R1의 오픈 소스는 대형 모델 기술 분야에서 중국의 혁신을 보여줄 뿐만 아니라 글로벌 AI 개발에 새로운 활력을 불어넣습니다.
텍스트: 최근 중국 DeepSeek 팀은 최신 오픈 소스 대형 모델 R1을 출시하여 광범위한 관심을 끌었습니다. R1 모델의 성능은 매우 우수하여 많은 테스트, 특히 수학과 프로그래밍 평가에서 OpenAI의 o1 모델을 능가합니다.
최근 미국 AIME2024 테스트에서 R1은 79.8점을 획득해 o1의 79.2점을 넘어섰습니다. MATH-500 테스트에서 R1은 97.3점을 얻었으며, 이는 o1의 96.4점보다 앞섰습니다. 또한 SWE-bench Verified 테스트에서도 R1은 49.2점을 기록해 o1의 48.9점을 넘어섰다. 코드 테스트 Codeforces에서 R1은 o1보다 0.3포인트만 낮지만 전체 성능은 o1 모델과 동일합니다.
성능 외에도 R1의 비용 이점은 더욱 눈길을 끕니다. OpenAI의 o1 모델의 입력 수수료는 토큰 100만개당 최대 15달러인 반면, R1의 비용은 0.14달러에 불과해 비용이 90% 절감됩니다. 출력 측면에서 o1의 수수료는 토큰 100만 개당 미화 60달러인 반면, R1의 비용은 미화 2.19달러로 27배 절감됩니다. 이러한 엄청난 비용 차이로 인해 R1은 오픈 소스 대형 모델 분야에서 두각을 나타냅니다.
DeepSeek 팀이 R1이 오픈 소스라고 발표한 후 많은 해외 네티즌들은 R1이 비용 성능과 성능 측면에서 Meta 및 Mistral과 같은 기존 오픈 소스 플랫폼을 능가했다고 믿으며 이 모델에 대한 감탄을 표했습니다. 많은 사람들은 R1 모델의 효율적인 추론 능력으로 인해 코드 작성 및 수학적 설명이 뛰어나다고 말합니다. 일부 사용자는 이를 "인간 내면의 독백과 가장 유사한 모델"이라고 부르기도 합니다. 동시에 Apple의 기계 학습 연구원인 Awni Hannun도 R1을 테스트한 결과 Apple M2Ultra에서 R1이 빠르게 실행되고 추론 효율성이 높다는 사실을 발견했습니다.
R1 모델 개발은 추론 능력과 가독성을 향상시키기 위해 콜드 스타트 데이터와 다단계 학습을 포함한 다단계 학습 프로세스를 거쳤습니다. 이러한 기술적 개선으로 다양한 작업에서 R1 모델의 탁월한 성능이 보장됩니다.
R1 출시와 함께 중국의 대형 오픈소스 모델은 다시 한번 국제 시장에서 큰 관심과 논의를 불러일으켰고, 많은 기술 애호가들은 이 모델의 잠재력에 대한 기대를 표명했습니다. R1의 출시는 대형 모델 기술 분야에서 중국의 추가적인 돌파구를 의미하며 오픈 소스 기술의 개발을 촉진합니다.
오픈소스 주소: https://huggingface.co/deepseek-ai/R1
API: https://api-docs.deepseek.com/guides/reasoning_model
가장 밝은 부분:
R1 모델은 여러 테스트에서 OpenAI의 o1을 능가하며 뛰어난 성능을 보여주었습니다.
R1의 입력 및 출력 비용은 각각 $0.14 및 $2.19로 90%의 비용 절감 효과를 제공합니다.
R1은 오픈 소스이기 때문에 많은 주목을 받았습니다. 많은 외국 전문가들은 그 성능을 높이 평가하고 비용 효율성이 매우 높다고 믿었습니다.
R1의 등장은 개발자에게 고성능, 저비용의 강력한 도구를 제공할 뿐만 아니라 인공지능 분야에서 중국의 지속적인 혁신과 경쟁력 향상을 예고합니다. 우리는 R1이 앞으로 더 많은 분야에서 획기적인 발전을 가져올 것을 기대합니다.