DeepSeek은 OpenAI의 o1 공식 버전과 성능이 비슷한 대규모 언어 모델 R1의 공식 출시 및 오픈 소스를 발표했습니다. R1은 훈련 후 단계에서 강화학습 기술을 광범위하게 사용합니다. 데이터 주석의 양이 적더라도 강력한 추론 능력을 유지하고 수학, 코드, 자연어 추론에서 좋은 성능을 발휘할 수 있습니다. DeepSeek은 또한 2개의 660B 매개변수 크기 모델(R1 및 R1-Zero)과 모델 증류 기술을 사용하는 6개의 소형 모델(32B 및 70B 매개변수 모델 포함)을 오픈소스화했는데, 이 모델의 성능은 OpenAI의 o1-mini를 능가했습니다. 또한 DeepSeek은 매우 경쟁력 있는 API 가격 계획을 제공하고 MIT 라이선스를 채택하여 무제한적인 상업적 사용을 허용하고 사용자가 R1을 기반으로 2차 개발을 수행하도록 권장합니다.
DeepSeek R1은 성능, 오픈 소스 전략 및 API 가격 측면에서 강력한 강점과 개방적인 태도를 보여주었습니다. 이는 국내 AI 기술의 상당한 발전을 의미하며 글로벌 AI 개발자에게 더 많은 선택과 가능성을 제공합니다. 오픈소스 R1과 관련 리소스의 공개는 AI 기술의 대중화와 발전을 촉진하고 AI 기술 평등권 시대의 도래를 가속화할 것이다. 자세한 내용은 다음 링크를 참조하세요. Paper: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf API 문서: https://api-docs.deepseek.com/zh-cn /가이드/추론_모델