Microsoft의 최신 Rstar-Math 기술은 수학적 추론 분야에서 인공 지능의 주요 획기적인 획기적인 것입니다. 이 혁신적인 기술은 소규모 언어 모델 (SLM)을 위해 특별히 설계되었으며 고유 한 추론 방법을 통해 복잡한 수학적 문제를 해결할 때 이러한 모델의 기능을 크게 향상시킵니다. 여러 테스트에서 RSTAR-Math 기술은 여러 오픈 소스 모델의 성능을 크게 향상시킬뿐만 아니라 특정 시나리오에서 OpenAI의 O1- 프리뷰 모델을 능가하는 것도 업계에서 널리 알려졌습니다.
Rstar-Math 기술의 핵심은 혁신적인 Monte Carlo Tree Search (MCTS) 응용 프로그램에 있습니다. 이 방법은 인간의 깊은 사고 과정을 시뮬레이션하여 소규모 언어 모델이 수학적 문제에 대한 솔루션을 점차적으로 정제하고 최적화함으로써 자기 진화를 달성하도록 돕습니다. 연구팀은 모델에 최종 답변을 출력하도록 요청했을뿐만 아니라 상세한 자연어 추론 단계와 해당 파이썬 코드를 제공하도록 요청했습니다.
특정 테스트에서 Rstar-Math 기술은 Microsoft의 PHI-3 MINI 모델, Alibaba의 QWEN-1.5B 및 QWEN-7B 모델을 포함한 여러 잘 알려진 오픈 소스 모델에 적용됩니다. 테스트 결과는 테스트에 참여하는 모든 모델이 수학 벤치 마크에서 크게 수행되었음을 보여줍니다. RSTAR-Math 기술을 적용한 후 QWEN2.5-MATH-7B 모델의 정확도는 58.8%에서 90.0%로 증가했을뿐만 아니라 OpenAI의 O1-PREVIEW 모델을 능가했을뿐만 아니라 작은 모델도 보여주었습니다. 특정 분야에서 모델의 큰 잠재력.
연구팀은 GITHUB에 대한 관련 코드와 데이터를 공개 할 계획 이며이 결정은 AI 커뮤니티에서 널리 환영했습니다. 많은 전문가들은 RSTAR-Math 기술과 Monte Carlo Tree Search의 조합, 특히 기하학적 증거 및 상징적 추론과 같은 분야의 응용 프로그램이 수학 관련 분야에서 인공 지능의 개발을 촉진 할 것이라고 생각합니다. 이 단계별 추론 방법은 모델의 정확성을 향상시킬뿐만 아니라 향후 연구를위한 새로운 방향을 제공합니다.
RSTAR-Math 기술의 성공은 또한 인공 지능의 현재 개발 모델에 대한 반영을 유발했습니다. 최근에 AI 분야의 혁신은 주로 모델 매개 변수의 지속적인 증가에 의존했습니다.이 "더 큰"개발 모델은 성능 향상에도 불구하고 높은 비용과 환경 적 부담도 동반합니다. Microsoft는 RSTAR-Math 기술을 갖춘 소규모 모델의 잠재력을 보여 주어 중간 규모의 조직 및 학술 연구원에게 큰 비용을 부담하지 않고 최첨단 AI 기능을 얻을 수있는 새로운 옵션을 제공합니다.
특정 응용 시나리오에서 RSTAR-Math 기술은 놀라운 결과를 보여주었습니다. 미국 수학 초청 (AIME) 테스트에서 RSTAR-Math 기술을 사용하는 모델은 53.3%의 문제를 해결했으며 이는 고등학교 참가자의 상위 20%에 해당합니다. 이러한 성과는 실제 응용 분야 에서이 기술의 효과를 증명할뿐만 아니라 교육 분야의 향후 적용 가능성을 제공합니다.
Microsoft, Peking University 및 Tsinghua University의 8 명의 연구원이 공동으로 완료 한이 논문은 ARXIV.org에 출판되어 학업 및 산업에 자세한 기술 세부 사항과 실험 데이터를 제공합니다. 다가오는 코드 및 데이터 공개로 인해 더 많은 연구자 들이이 분야에 참여하여 RSTAR-Math 기술의 추가 개발 및 개선을 촉진 할 것으로 예상됩니다.
Rstar-Math 기술의 출시는 특정 작업에서 소규모 언어 모델의 큰 잠재력을 보여줄뿐만 아니라 인공 지능 개발을위한 새로운 아이디어를 제공합니다. 더 큰 모델을 추구하는 동안 기술 혁신을 통해 소규모 모델의 성능을 향상시키는 방법은 향후 AI 연구에서 중요한 방향 중 하나가 될 것입니다. 이 기술의 성공은 새로운 라운드의 기술 경쟁을 유발하고 전체 산업이보다 효율적이고 지속 가능한 방향으로 개발하도록 촉진 할 수 있습니다.