IBM은 엔터프라이즈급 AI 분야 선도를 목표로 하는 차세대 오픈 소스 대형 언어 모델 Granite3.1의 출시를 발표했습니다. Granite3.1은 128K까지 확장된 컨텍스트 길이, 효율적인 임베딩 모델, 내장된 환각 감지 기능, 대폭 향상된 전반적인 성능 등 많은 특징을 갖추고 있습니다. IBM에 따르면 Granite8B Instruct 모델은 Meta의 Llama3.1, Qwen2.5 및 Google의 Gemma2와 같은 경쟁사를 능가하여 동일한 규모의 오픈 소스 모델 중에서 가장 좋은 성능을 발휘합니다. 이 새로운 모델의 출시는 지난 10월 Granite 3.0 출시에 이어 생성 AI 분야에 대한 IBM의 신속한 반복과 지속적인 투자를 반영하여 관련 비즈니스 수익이 20억 달러에 달했습니다.
IBM은 차세대 오픈 소스 대형 언어 모델 Granite3.1을 공식 출시하여 엔터프라이즈급 AI 분야에서 선도적인 위치를 차지하기 위해 노력하고 있습니다. 이 모델 시리즈는 128K 확장된 컨텍스트 길이, 임베딩 모델, 내장된 환각 감지 기능 및 상당한 성능 개선을 특징으로 합니다.
IBM은 Granite8B Instruct 모델이 Meta의 Llama3.1, Qwen2.5 및 Google의 Gemma2를 포함하여 동일한 규모의 오픈 소스 경쟁사 중에서 가장 우수한 성능을 발휘한다고 주장합니다.
Granite3.1 모델의 출시는 IBM의 Granite 시리즈의 빠른 반복을 배경으로 10월에 출시되었습니다. IBM은 AI 생성과 관련된 사업 수익이 20억 달러에 달했다고 밝혔습니다. 새 버전의 핵심 아이디어는 더 작은 모델에 더 많은 기능을 통합하여 비즈니스 사용자가 더 쉽고 비용 효율적으로 실행할 수 있도록 하는 것입니다.
IBM 리서치 부사장 데이비드 콕스는 Granite 모델이 IBM 내부 제품, 컨설팅 서비스, 고객 서비스 등에서 널리 사용되고 있고, 오픈소스 형태로도 출시되기 때문에 모든 면에서 높은 수준에 도달해야 한다고 말했다. 모델 성능 평가는 속도뿐만 아니라 효율성에도 의존하므로 사용자가 결과를 얻을 때 시간을 절약할 수 있습니다.
컨텍스트 길이 측면에서 Granite3.1의 개선은 특히 4K의 첫 번째 버전에서 128K로 확장되어 뚜렷합니다. 이는 특히 RAG(검색 강화 생성) 및 지능형 에이전트 AI 측면에서 엔터프라이즈 AI 사용자에게 특히 중요합니다. 확장된 컨텍스트 길이를 통해 모델은 더 긴 문서, 로그 및 대화를 처리할 수 있으므로 복잡한 쿼리를 더 잘 이해하고 응답할 수 있습니다.
IBM은 또한 데이터를 벡터로 변환하는 프로세스 속도를 높이기 위해 일련의 임베딩 모델을 출시했습니다. 그 중 Granite-Embedding-30M-English 모델의 쿼리 시간은 0.16초로 경쟁사 제품보다 빠릅니다. Granite3.1의 성능 향상을 달성하기 위해 IBM은 다단계 교육 프로세스와 고품질 교육 데이터 사용을 혁신했습니다.
환각 감지 측면에서 Granite3.1 모델은 환각 보호 기능을 모델에 통합하여 자체 감지하고 잘못된 출력을 줄일 수 있습니다. 이 기본 제공 감지는 전반적인 효율성을 최적화하고 추론 호출 수를 줄입니다.
현재 Granite3.1 모델은 기업 사용자에게 무료로 공개되어 있으며 IBM의 Watsonx 기업 AI 서비스를 통해 제공됩니다. 앞으로 IBM은 빠른 업데이트 속도를 유지할 계획이며 Granite 3.2는 2025년 초에 다중 모드 기능을 출시할 예정입니다.
공식 블로그: https://www.ibm.com/new/announcements/ibm-granite-3-1-powerful-performance-long-context-and-more
하이라이트:
IBM은 오픈 소스 대형 언어 모델 시장에서 선도적인 위치를 차지하기 위해 Granite3.1 모델을 출시했습니다.
새 모델은 128K 컨텍스트 길이를 지원하여 처리 기능과 효율성을 크게 향상시킵니다.
환상 감지 기능이 모델에 통합되어 전반적인 성능과 정확성이 최적화됩니다.
전체적으로 Granite3.1의 출시는 오픈 소스 대규모 언어 모델 분야에서 IBM의 또 다른 주요 진전을 의미합니다. 강력한 성능과 풍부한 기능은 기업 사용자에게 더욱 편리하고 효율적인 AI 경험을 제공할 것입니다. 앞으로의 반복은 기대할만한 가치가 있습니다.