프랑스 AI 스타트업 Les Ministraux는 엣지 장치용으로 설계된 매개변수가 각각 30억 개와 80억 개인 Ministral3B와 Ministral8B라는 두 가지 경량 AI 모델을 출시했습니다. 이 두 모델은 벤치마크 테스트 후 수업에서 탁월한 성능을 보였으며, 특히 지식, 상식, 추론 및 효율성 측면에서 동일한 수준의 모델을 능가하는 성능을 발휘하여 일부 측면에서 더 큰 매개변수를 사용하는 모델을 능가하는 성능을 보였습니다. 매개변수 모델. Downcodes의 편집자는 이 두 모델의 성능, 기능 및 회사에 대한 자세한 설명을 제공합니다.
프랑스 AI 스타트업 Les Ministraux는 각각 30억과 80억의 매개변수를 가진 엣지 장치용으로 특별히 설계된 Ministral3B와 Ministral8B라는 두 가지 새로운 경량 모델을 출시했습니다. Ministral3B가 Llama38B 및 Mistral7B를 능가하는 등 벤치마크 이후의 명령에서 두 모델이 좋은 성능을 보인 반면 Ministral8B는 코드 기능을 제외한 모든 측면에서 이 두 모델보다 성능이 뛰어났습니다.
테스트 결과 Minitral3B 및 Minitral8B의 성능은 Gemma2 및 Llama3.1과 같은 오픈 소스 모델과 비슷하다는 것을 보여줍니다. 두 모델 모두 최대 128,000개의 컨텍스트를 지원하고 지식, 상식, 추론, 함수 호출 및 효율성 측면에서 10B 미만 매개변수 모델에 대한 새로운 벤치마크를 설정합니다. Ministral8B에는 또한 더 빠르고 효율적인 인메모리 추론을 위한 슬라이딩 윈도우 어텐션 메커니즘이 장착되어 있습니다. 복잡한 AI 에이전트 워크플로우 관리 또는 전문 작업 도우미 생성과 같은 다양한 사용 사례에 맞게 미세 조정할 수 있습니다.
연구원들은 Les Ministraux 모델에 대해 지식과 상식, 코딩, 수학 및 다중 언어 사용과 같은 측면을 다루는 여러 벤치마크 테스트를 수행했습니다. 사전 훈련 모델 단계에서 Minitral3B는 Gema22B 및 Llama3.23B와 비교하여 최상의 결과를 얻었습니다. Llama3.18B 및 Mistral7B와 비교하여 Mistral8B는 코딩 기능을 제외한 모든 측면에서 가장 좋은 성능을 보였습니다. 미세 조정 후 명령 모델 단계에서는 Minitral3B가 다양한 벤치마크 테스트에서 가장 좋은 결과를 얻었고 Minitral8B는 Wild 벤치에서 Gema29B보다 약간 열등했습니다.
Les Ministraux 모델의 출시는 사용자에게 중요한 애플리케이션에 대한 로컬 우선 추론에 대한 점점 더 많은 사용자의 요구를 충족하는 계산 효율성이 높고 대기 시간이 짧은 솔루션을 제공합니다. 사용자는 이러한 모델을 기기 내 번역, 인터넷 연결이 필요 없는 스마트 도우미, 자율 로봇과 같은 시나리오에 적용할 수 있습니다. Ministral8B의 입력 및 출력 가격은 백만 토큰당 US$0.1이고 Ministral3B의 입력 및 출력 가격은 백만 토큰당 US$0.04입니다.
미스트랄은 이전에도 마그넷 링크를 통해 여러 모델을 오픈소스화해 AI 커뮤니티에서 인정받았다는 점은 주목할 만하다. 하지만 올해는 예전만큼 개방적이지 않아 논란에 휩싸였다. Microsoft가 Mistral의 주식 일부를 인수하고 이에 투자할 것이라는 소식이 있는데, 이는 Mistral의 모델이 Azure AI에서 호스팅된다는 의미입니다. Reddit 네티즌들은 Mistral이 공식 웹사이트에서 오픈소스에 대한 약속을 삭제했다는 사실을 발견했습니다. 이번에 출시된 Ministral3B, Ministral8B 등 일부 회사 모델도 충전을 시작했습니다.
세부정보: https://mistral.ai/news/ministraux/
전체적으로 Minitral3B 및 Minitral8B의 출현은 엣지 컴퓨팅 AI 애플리케이션에 대한 강력한 선택을 제공하며 효율적인 성능과 저렴한 가격으로 상당한 경쟁 우위를 제공합니다. 그러나 Mistral의 전략 변화는 오픈 소스 모델과 상용화 간의 균형에 대한 업계의 생각을 촉발하기도 했습니다. 앞으로도 Les Ministraux 모델의 적용과 개발에 계속해서 관심을 기울일 예정입니다.