Nous Research는 대규모 AI 모델 훈련이 대기업에만 국한되어 있는 상황을 깨고 혁신적인 AI 훈련 최적화 프로그램인 DisTrO를 출시합니다. DisTrO는 여러 GPU 간의 데이터 전송량을 크게 줄여 일반 네트워크 환경에서도 AI 모델을 효율적으로 훈련할 수 있습니다. 이를 통해 AI 모델 훈련의 문턱이 크게 낮아지고 더 많은 개인과 기관이 AI 기술 개발에 참여할 수 있습니다. 및 개발이 진행 중입니다. 이번 혁신 기술은 AI 분야의 연구개발 모델을 완전히 바꾸고, AI 기술의 대중화와 발전을 촉진할 것으로 기대된다.
최근 Nous Research의 연구팀은 DisTrO(분산 인터넷 교육)라는 새로운 최적화 프로그램을 출시하여 기술계에 흥미로운 소식을 가져왔습니다. 이 기술의 탄생은 강력한 AI 모델이 대기업만의 특허가 아니라 일반 사람들도 집에서 효율적인 훈련을 위해 자신의 컴퓨터를 사용할 수 있는 기회를 갖게 되었음을 의미합니다.
DisTrO의 마법은 AI 모델을 훈련할 때 여러 그래픽 처리 장치(GPU) 간에 전송해야 하는 정보의 양을 크게 줄일 수 있다는 것입니다. 이러한 혁신을 통해 강력한 AI 모델은 일반적인 네트워크 조건에서 훈련될 수 있으며, 전 세계 개인이나 기관이 힘을 합쳐 AI 기술을 공동 개발할 수도 있습니다.
Nous Research의 기술 논문에 따르면 DisTrO의 효율성 향상은 일반적인 알고리즘인 All-Reduce보다 857배 더 높습니다. 동시에 각 훈련에서 전송되는 정보의 양도 많습니다. 단계도 74.4GB에서 86.8MB로 줄었습니다. 이러한 개선으로 인해 교육이 더 빠르고 저렴해질 뿐만 아니라 더 많은 사람들이 이 분야에 참여할 수 있는 기회를 얻게 됩니다.
Nous Research는 DisTrO를 통해 연구원과 기관이 더 이상 교육 프로세스를 관리하고 제어하기 위해 특정 회사에 의존할 필요가 없으므로 소셜 플랫폼에서 혁신과 실험을 더 자유롭게 할 수 있다고 밝혔습니다. 이러한 공개 경쟁 환경은 기술 발전을 촉진하고 궁극적으로 사회 전체에 이익이 됩니다.
AI 훈련에서는 하드웨어 요구 사항이 까다로울 때가 많습니다. 특히, 고성능 Nvidia GPU는 이 시대에 점점 희귀해지고 비싸지고 있으며, 자금이 충분한 일부 회사만이 이러한 교육에 대한 부담을 감당할 수 있습니다. 그러나 Nous Research의 철학은 정반대입니다. 그들은 AI 모델 교육을 더 저렴한 비용으로 대중에게 공개하고 더 많은 사람들이 참여할 수 있도록 노력하고 있습니다.
DisTrO는 GPU 간의 전체 그래디언트 동기화 필요성을 줄여 통신 오버헤드를 4~5배 줄이는 방식으로 작동합니다. 이러한 혁신을 통해 AI 모델은 느린 인터넷 연결에서 훈련될 수 있으며, 오늘날 많은 가정에서 쉽게 액세스할 수 있는 100Mbps 다운로드 및 10Mbps 업로드 속도이면 충분합니다.
Meta의 Llama2 대규모 언어 모델에 대한 예비 테스트에서 DisTrO는 필요한 의사소통 양을 크게 줄이면서 기존 방법과 비슷한 훈련 결과를 보여주었습니다. 연구진은 또한 지금까지 더 작은 모델에서만 테스트했지만 모델의 크기가 커질수록 통신 요구 사항의 감소가 1,000~3,000배에 달할 정도로 훨씬 더 커질 수 있다고 잠정적으로 추측했다고 말했습니다.
DisTrO가 훈련을 보다 유연하게 만들지만 여전히 GPU 지원에 의존하지만 이제는 이러한 GPU를 같은 장소에 모을 필요가 없으며 전 세계에 분산되어 일반 인터넷을 통해 협업할 수 있다는 점은 주목할 가치가 있습니다. 우리는 DisTrO가 32개의 H100 GPU를 사용하여 엄격한 테스트를 거쳤을 때 수렴 속도 측면에서 전통적인 AdamW+All-Reduce 방법과 일치할 수 있었지만 통신 요구 사항이 크게 감소했음을 확인했습니다.
DisTrO는 대규모 언어 모델에 적합할 뿐만 아니라 이미지 생성 모델과 같은 다른 유형의 AI를 훈련하는 데에도 사용될 수 있습니다. 미래의 응용 전망은 흥미진진합니다. 또한 DisTrO는 훈련 효율성을 개선함으로써 기존 인프라의 사용을 최적화하고 대규모 데이터 센터의 필요성을 줄이므로 AI 훈련이 환경에 미치는 영향을 줄일 수도 있습니다.
Nous Research는 DisTrO를 통해 AI 훈련의 기술 발전을 촉진할 뿐만 아니라 미래 AI 개발의 무한한 가능성을 열어주는 보다 개방적이고 유연한 연구 생태계를 촉진합니다.
참고: https://venturebeat.com/ai/this-could-change-everything-nous-research-unveils-new-tool-to-train-powerful-ai-models-with-10000x-efficiency/
DisTrO의 출현은 AI 훈련의 민주화 과정을 예고하고, 참여 문턱을 낮추며, AI 기술의 신속한 발전과 광범위한 적용을 촉진하고, AI 분야에 새로운 활력과 무한한 가능성을 가져옵니다. 앞으로 우리는 DisTrO가 AI 개발에 더 많은 놀라움을 가져올 것으로 기대합니다.