AI2 오픈소스 훈련 솔루션 Tülu 3, 대형 모델 사후 훈련 기술 독점 깨뜨려

저자：Eve Cole 업데이트 시간：2025-01-29 09:36:01

오픈소스 AI 분야는 최근 몇 년간 붐을 일으키고 있지만 여전히 대형 기술 기업과 비교하면 격차가 있다. 컴퓨팅 성능은 단지 하나의 측면일 뿐이며, 더 중요한 측면은 사후 교육 솔루션이 부족하다는 점입니다. AI2(구 Allen Artificial Intelligence Institute)의 최신 혁신인 Tülu3 사후 훈련 프로그램은 이러한 격차를 해소할 수 있는 강력한 무기를 제공합니다. Downcodes의 편집자는 이 기술이 오픈 소스 AI에 어떻게 힘을 실어주고 원래 제어하기 어려웠던 대규모 언어 모델을 쉽게 사용하고 사용자 정의할 수 있는지에 대한 심층적인 이해를 제공합니다.

오픈소스 AI 분야에서 대기업과의 격차는 컴퓨팅 파워에만 반영되는 것이 아니다. AI2(이전 Allen Artificial Intelligence Institute)는 일련의 획기적인 이니셔티브를 통해 이러한 격차를 해소하고 있습니다. 새로 출시된 Tülu3 사후 교육 프로그램을 통해 원래의 대규모 언어 모델을 실용적인 AI 시스템으로 변환할 수 있습니다.

일반적인 인지와 달리 기본 언어 모델은 사전 훈련 후에 바로 사용할 수 없습니다. 실제로 학습 후 과정은 모델의 최종 값을 결정하는 핵심 링크입니다. 이 단계에서 모델은 판단력이 부족한 전지적 네트워크에서 특정 기능적 방향을 가진 실용적인 도구로 전환됩니다.

오랫동안 대기업들은 사후 교육 프로그램에 대해 비밀을 유지해 왔습니다. 최신 기술을 활용하면 누구나 모델을 구축할 수 있지만, 심리상담이나 연구 분석 등 특정 분야에서 유용한 모델을 만들기 위해서는 독특한 사후 훈련 기법이 필요하다. 오픈 소스로 광고되는 Meta의 Llama와 같은 프로젝트의 경우에도 원본 모델의 소스와 일반적인 훈련 방법은 여전히 엄격히 기밀입니다.

Tülu3의 출현으로 이러한 상황이 바뀌었습니다. 이 완전한 사후 교육 솔루션 세트는 주제 선택부터 데이터 관리, 강화 학습부터 미세 조정까지 모든 프로세스를 포괄합니다. 사용자는 수학 및 프로그래밍 기능을 강화하거나 다국어 처리 우선순위를 낮추는 등 필요에 따라 모델 기능을 조정할 수 있습니다.

AI2의 테스트는 Tülu3가 훈련한 모델의 성능이 최고의 오픈 소스 모델 수준에 도달했음을 보여줍니다. 이러한 혁신은 매우 중요합니다. 이는 기업에 완전히 자율적이고 제어 가능한 선택권을 제공합니다. 특히 의료 연구와 같이 민감한 데이터를 처리하는 기관의 경우 더 이상 타사 API나 맞춤형 서비스에 의존할 필요가 없으며 전체 교육 프로세스를 로컬에서 완료하여 비용을 절감하고 개인정보를 보호할 수 있습니다.

AI2는 이 솔루션을 출시했을 뿐 아니라 자사 제품에 적용하는 데 앞장섰다. 현재 테스트 결과는 Llama 모델을 기반으로 하지만 자체 OLMo를 기반으로 하고 Tülu3에서 교육한 새로운 모델을 출시할 계획을 가지고 있습니다. 이는 처음부터 끝까지 완전히 완전한 오픈 소스 솔루션이 될 것입니다.

이 오픈 소스 기술은 AI의 민주화를 촉진하려는 AI2의 결의를 보여줄 뿐만 아니라 전체 오픈 소스 AI 커뮤니티에 활력을 불어넣습니다. 이를 통해 우리는 진정으로 개방적이고 투명한 AI 생태계에 한 걸음 더 가까워질 수 있습니다.

Tülu3의 오픈 소스는 오픈 소스 AI 분야에서 큰 진전을 이루었습니다. AI 애플리케이션의 문턱을 낮추고 AI 기술의 공정성과 공유를 촉진하며 미래 AI 개발에 무한한 가능성을 제공합니다. 우리는 보다 번영하는 AI 생태계를 공동으로 구축하기 위해 더 유사한 오픈 소스 프로젝트의 출현을 기대합니다.