오픈 소스 AI 필드는 오랫동안 컴퓨팅 전력 및 사후 훈련 기술 분야에서 대규모 기술 회사의 장점으로 제한되어 왔습니다. 그러나 AI2 (이전 Allen Artificial Intelligence Research Institute)가 시작한 Tülu3 포스트 트레이닝 계획은 현 상태를 바꾸려고 노력하고 있습니다. Tülu3는 완전하고 맞춤형 포스트 트레이닝 프로세스를 제공하여 사용자가 요구에 따라 모델 기능을 조정하고 특정 필드에서 모델의 효과적인 응용 프로그램을 구현할 수 있습니다. 이 기술 혁신은 오픈 소스 AI의 애플리케이션 임계 값을 줄일뿐만 아니라 기업 및 기관, 특히 의료 연구와 같은 민감한 데이터 처리와 관련된 영역에서보다 제어 가능한 선택을 제공합니다.
오픈 소스 AI 분야에서 대규모 기술 회사와의 격차는 컴퓨팅 전력에만 반영되지 않습니다. AI2 (이전 Allen Intelligence Research Institute)는 일련의 선구적인 조치를 통해이 격차를 좁히고 있습니다.
일반적인 인식과는 달리 기본 언어 모델은 사전 트레이닝 후 직접 사용할 수 없습니다. 실제로, 포스트 -트레이닝 프로세스는 모델의 궁극적 값을 결정하기위한 핵심 링크입니다. 이 단계에서 모델은 "전능 한"에서 판단력이 부족한 특정 기능 방향을 가진 실용적인 도구로 변경되었습니다.
오랫동안 주요 회사는 포스트 트레이닝 계획에 금기가되었습니다. 누구나 최신 기술을 사용하여 모델을 구축 할 수 있지만, 모델이 특정 분야 (예 : 심리 상담 또는 연구 및 분석과 같은 역할을 수행 할 수 있도록 할 수는 있지만, 고유 한 사후 훈련 기술이 필요합니다. Meta의 LLAMA 라벨 "오픈 소스"프로젝트에도 불구하고 원래 모델의 소스 및 일반 교육 방법은 여전히 기밀로 엄격합니다.
Tülu3의 출현으로 인해이 상황이 바뀌 었습니다. 이 완전한 포스트 트레이닝 체계는 테마 선택에서 데이터 거버넌스, 학습 강화에서 미세 조정에 이르기까지 모든 프로세스를 다룹니다. 사용자는 수학 및 프로그래밍 강화 또는 다중 언어 처리 우선 순위를 줄이는 등 수요에 따라 모델 기능을 조정할 수 있습니다.
AI2 테스트에 따르면 Tülu3가 훈련 한 모델의 성능은 최상위 오픈 소스 모델에 도달했음을 보여줍니다. 이 돌파구는 매우 중요합니다. 회사에 완전히 자율적이고 제어 가능한 선택을 제공합니다. 특히 의료 연구와 같은 민감한 데이터를 처리하는 기관의 경우, 제 3 자 API 또는 맞춤형 서비스에 의존 할 필요가 없습니다.
AI2는이 솔루션을 공개했을뿐만 아니라 먼저 자체 제품에 적용했습니다. 현재 테스트 결과는 LLAMA 모델을 기반으로하지만 자체 OLMO 및 Tülu3 Training을 기반으로 새로운 모델을 출시 할 계획이며, 이는 처음부터 끝까지 오픈 소스 인 솔루션이 될 것입니다.
이번에는 기술 오픈 소스는 AI 민주화를 촉진하기위한 AI2의 결정을 보여줄뿐만 아니라 환각 대리인을 전체 오픈 소스 AI 커뮤니티에 주입합니다. 그것은 우리가 실제 개방적이고 투명한 AI 생태계에 한 걸음 더 다가 갈 수있게 해줍니다.
Tülu3의 오픈 소스는 AI 필드의 발달에 새로운 활력을 주입하여 더 개방적이고 투명한 AI 미래를 나타냅니다. 이는 AI 기술의 대중화 및 적용을 촉진하고 AI 민주화 과정을 홍보하며 AI 기술의 진전으로 더 많은 사람들에게 혜택을 줄 것입니다.