Allen Institute for Artificial Intelligence는 여러 대학과 협력하여 세계 최초의 완전 오픈 소스 대규모 언어 모델 OLMo를 공동 출시했습니다. 이는 인공지능 분야에서 중요한 이정표를 세우며, 더욱 투명하고 개방적인 대형 모델 기술 개발을 촉진할 것입니다. OLMo에는 모델 가중치, 코드, 데이터 세트 및 전체 교육 프로세스가 포함되어 있으며 7B 매개변수 버전은 여러 작업에서 잘 작동합니다. 또한 연구팀은 사전 훈련 데이터 세트인 Dolma를 공개하고 데이터 대조 및 분석 도구를 제공하여 데이터 투명성을 극대화했는데, 이는 학계와 산업계에서 대규모 언어 모델의 연구 및 적용을 촉진하는 데 매우 중요한 의미를 갖습니다.
Allen Institute for Artificial Intelligence와 여러 대학은 가중치, 코드, 데이터 세트 및 전체 교육 프로세스를 포함하여 세계 최초의 100% 오픈 소스 대형 모델 OLMo를 출시했습니다. 성능 평가에 따르면 OLMo-7B는 많은 작업에서 약간 우월한 것으로 나타났습니다. 동시에 연구자들은 언어 모델 사전 훈련 분야의 공개 연구를 촉진하기 위해 사전 훈련 데이터 세트 Dolma를 공개했습니다. 데이터 투명성 측면에서 데이터 대조 도구 및 분석 도구가 제공됩니다.
OLMo의 오픈 소스 릴리스는 대규모 모델 연구의 문턱을 낮출 뿐만 아니라 글로벌 인공 지능 커뮤니티에 귀중한 리소스를 제공하여 보다 개방적이고 협력적인 인공 지능 생태계의 도래를 예고합니다. 앞으로는 OLMo를 기반으로 한 더욱 혁신적인 응용과 연구 결과가 나올 것으로 기대된다.