최근 칭화대가 출시한 국내 대형 모델 미스트랄(Mistral)이 깃허브(GitHub)에서 뜨거운 반응을 불러일으켰다. 2B 사이즈는 수많은 '대형' 모델을 능가하는 성능을 갖고 있어 놀랍다. 이는 강력한 성능뿐만 아니라 극도로 낮은 비용 이점에도 반영됩니다. 1,700,000개 토큰의 추론 비용은 단 1위안으로 얻을 수 있으며 이는 유사한 제품보다 훨씬 저렴합니다. 또한 Mistral은 다중 모드 기능도 갖추고 있어 강력한 적용 가능성을 보여줍니다. 이번 사건은 AI 분야에서 우수한 모델 설계와 비용 관리가 똑같이 중요하며 단순히 '볼륨이 왕'이 아니라는 점을 다시 한번 입증했다.
이 기사는 다음에 중점을 둡니다.
최근 칭화대학교 학과에서는 크기가 2B에 불과한 국산 미스트랄(Mistral)을 출시했는데, 뜻밖에도 GitHub에서 뜨거운 환영을 받으며 하루 만에 별 300개 이상을 얻었습니다. 성능 면에서 이 제품은 성능과 크기 사이에 상당한 차이가 있습니다. 많은 성과에서 주류의 "대용량" 대형 모델을 능가했습니다. 비용 측면은 더욱 놀랍습니다. 추론 비용으로 1,700,000개의 토큰을 얻는 데 드는 비용은 유사 제품에 비해 훨씬 저렴합니다. 위의 기능 외에도 이 제품은 다중 모드 기능을 갖추고 있어 탁월한 결과를 보여줍니다.
미스트랄의 성공은 국산 대형 모델의 성능과 가격 측면에서 획기적인 발전을 보여주며, 향후 대형 모델 개발 방향에 대한 새로운 아이디어도 제시하고 있다. 앞으로도 비슷한 놀라움이 더 많이 나타나 AI 기술의 지속적인 발전을 촉진할 것이라고 믿습니다.