항저우 AI 기업 딥시크(DeepSeek)가 오픈AI(OpenAI)의 GPT-4, 앤트로픽(Anthropic)의 클로드 3.5소넷(Claude 3.5Sonnet)과 비슷한 성능을 저렴한 비용(560만달러)에 달성하는 최신 대규모 언어 모델 V3를 출시해 업계의 주목을 받았다. 이번 성과는 제한된 자원 하에서 DeepSeek의 강력한 연구 및 엔지니어링 능력을 강조하고 대규모 언어 모델의 연구 및 개발을 위한 새로운 아이디어를 제공하여 높은 투자가 높은 수익을 얻을 수 있다는 전통적인 개념에 도전합니다. V3 모델의 성공은 AI 분야의 향후 발전 가능성이 더 커졌음을 의미할 수도 있다.
최근 항저우에 위치한 AI 기업 딥시크(DeepSeek)가 최신 대규모 언어 모델인 V3를 출시했다. 여러 벤치마크 테스트에서 이 오픈 소스 모델의 성능은 OpenAI의 4o 및 Anthropic의 Claude3.5Sonnet의 성능과 유사하여 업계에 깊은 인상을 남겼습니다. 미국 경쟁업체가 수억 달러를 투자한 것과 비교하면 DeepSeek의 V3 모델의 총 비용은 560만 달러에 불과합니다. 이 엄청난 차이는 눈길을 끕니다.
DeepSeek의 CEO인 Liang Wenfeng은 V3가 H800 칩을 기반으로 훈련되었지만 DeepSeek 팀은 제한된 자원으로 여전히 강력한 연구 및 엔지니어링 역량을 보여줄 수 있다고 말했습니다.
AI 분야의 선구자인 Andrej Karpathy는 DeepSeek의 투자 예산이 "정말 농담"이었지만 최종 결과는 "자원 제약 하에서 매우 인상적인 연구 및 엔지니어링"이라고 말했습니다.
AGI는 문제 해결과 작업 수행에서 인간을 능가할 수 있는 AI 연구의 '성배'로 간주된다. 관련 전문가들은 일단 기술이 성숙되면 AGI를 가장 먼저 구현하는 국가가 막대한 경제적, 과학적, 안보적 이점을 갖게 될 것이라고 예측한다.
DeepSeek V3 모델의 성공은 저렴한 비용으로 획기적인 진전을 이룰 수 있음을 입증할 뿐만 아니라, 더 중요한 것은 글로벌 AI 연구 및 개발에 대한 새로운 관점과 방향을 제공하고 개발도상국이 첨단 기술을 따라잡는 데 도움이 된다는 것입니다. 인공지능 분야에서 희망을 얻었습니다. 앞으로는 이와 비슷한 '기적'이 더 많이 일어날 수도 있다.