상하이 인공 지능 연구소: 학자 Puyu 대형 모델 업그레이드 - AI 기사

저자：Eve Cole 업데이트 시간：2025-01-28 18:32:01

상하이 인공 지능 연구소(Shanghai Artificial Intelligence Laboratory)는 최근 자체 개발한 학자 모델이 대대적으로 업그레이드되어 Scholar Puyu 3.0(InternLM3)의 새 버전을 출시했다고 발표했습니다. 이 버전은 데이터 사용 효율성과 모델 성능에서 획기적인 발전을 이루었고, 더 낮은 비용으로 더 높은 성능을 달성했으며, 정기적인 대화와 심층적인 사고 기능을 처음으로 통합하여 실제 적용 시나리오에서 모델의 성능을 크게 향상시켰습니다. 이번 업그레이드는 기술적 혁신을 달성했을 뿐만 아니라 인공지능 분야에서 지속적인 혁신을 이루려는 중국의 결단력과 힘을 반영합니다.

Shanghai Artificial Intelligence Laboratory는 자사의 학자 모델이 중요한 버전 업그레이드를 받고 Scholar Puyu 3.0(InternLM3)을 출시했다고 발표했습니다. 연구실에 따르면 새 버전은 정제된 데이터 프레임워크를 통해 데이터 활용 효율성을 대폭 향상시켜 사고 밀도를 높인 것으로 나타났다.

업그레이드된 InternLM3-8B-Instruct 모델은 훈련에 4T의 데이터만 사용합니다. 관계자들은 이 모델의 종합적인 성능이 동일한 크기의 오픈 소스 모델보다 뛰어나며 훈련 비용이 75% 이상 절약된다고 말합니다. 이 버전은 처음으로 일반 모델에 정기적인 대화와 심층적 사고 기능을 통합하여 다양한 실제 사용 시나리오에 더 잘 대처할 수 있다는 점은 주목할 가치가 있습니다.

모델 평가 측면에서 연구팀은 Sinan OpenCompass 오픈소스 평가 프레임워크를 기반으로 통일되고 재현 가능한 평가 방법을 채택했습니다. 평가 콘텐츠에는 CMMLU 및 GPQA와 같은 10개 이상의 권위 있는 평가 세트가 포함되어 있으며 추론, 수학, 프로그래밍, 지침 따르기, 긴 텍스트 생성, 대화 및 종합적인 성능과 같은 다양한 차원을 다루고 있습니다. 평가 결과에 따르면 Shusheng Puyu 3.0은 대부분의 평가 세트에서 가장 높은 점수를 받았으며 전반적인 성능은 GPT-4o-mini에 매우 가깝습니다.

상하이 AI 연구소는 또한 이 새 버전의 모델이 오픈 소스 커뮤니티에서 브라우저 사용을 지원하는 최초의 범용 대화 모델이 되었으며 20단계 이상의 웹 페이지 점프를 지원하여 심층적인 마이닝이 가능하다고 밝혔습니다. 정보.

체험페이지 : https://internlm-chat.intern-ai.org.cn.

가장 밝은 부분:

Shusheng Puyu 3.0 모델은 4T 데이터로 학습되며, 종합적인 성능은 동일한 규모의 오픈 소스 모델을 능가하여 학습 비용을 75% 이상 절약합니다.

여러 권위 있는 평가 세트에서 선두를 달리는 모델 점수와 사고 및 대화 기능의 통합이 크게 향상되었습니다.

새로운 모델은 브라우저 사용을 지원하고 심층적인 정보 마이닝을 수행할 수 있어 오픈 소스 커뮤니티의 하이라이트 중 하나가 되었습니다.

전체적으로 Shusheng Puyu 3.0의 업그레이드는 대규모 언어 모델 분야에서 중국의 상당한 진전을 보여줍니다. 효율적인 훈련 방법과 강력한 성능은 더 많은 분야에서 인공 지능 기술의 적용을 촉진할 것으로 예상되며 주목할 가치가 있습니다. 앞으로의 발전을 기대합니다.