Alibaba International AI가 발표 한 최신 Marco-O1 추론 모델은 열린 문제를 해결하는 데 상당한 잠재력을 보여주었습니다. 그것은 표준 답변 분야로 제한된 전통적인 모델의 한계를 뚫고 정량화하기 어려운 영역의 응용 프로그램을 탐색하고 명확한 보상이 부족합니다. 이 모델의 핵심 기능은 우주 확장 전략을 조정하여 길고 어려운 번역과 같이 더 복잡하고 어려운 작업을 처리하고 강력한 추론 기능을 제공하는 고유 한 교육 방법입니다. 마르코 -O1의 오픈 소스는 또한 AI 연구 커뮤니티에 귀중한 자원을 제공합니다.
Alibaba International AI 팀은 최근 Marco-O1이라는 새로운 유형의 추론 모델을 발표했습니다. 연구팀은 그러한 모델이 정량화하기 어려운 영역과 명확한 보상이 부족한 지역으로 효과적으로 홍보 될 수 있는지 여부를 탐색하기 위해 노력하고 있습니다.
Marco-O1 모델의 특성에는 미세 조정에 초대형 COT 데이터 사용, MCT를 사용하여 공간을 확장하고 세밀한 공간 확장이 포함됩니다. 이 모델은 자체 플레이+MCT를 통해 반사 및 수정 기능을 갖춘 다수의 초대형 COT 데이터를 구축하며 다른 오픈 소스 데이터와 함께 교육을받습니다. 또한 연구팀은 모델의 솔루션 공간을 더욱 확장하기 위해 미니 단계를 정의하고 모델 출력을 더 나은 답변을 출력하도록 안내합니다.
번역 임무에서 Marco-O1 모델은 어려움을 다루는 능력을 보여주었습니다. 연구팀은 일부 COT 데이터 및 현재 최고의 모델의 오픈 소스이며 향후 더 많은 데이터 및 모델을 오픈 할 계획입니다.
이 모델은 예를 들어 출력 단어 '딸기'에서 'r'의 수가 단어의 각 문자를 점차 분해하고 결과를 비교할 때 생각할 때 생각할 것입니다. 기계 번역 분야 에서이 모델은 추론 링크를 통해 어려움을 올바르게 식별하고 Word로 번역하여 전체 변환 정확도를 향상시킵니다.
연구팀은 또한 다른 분야에서 모델이 다른 일반적인 현실 문제를 해결할 수 있음을 증명하기 위해 시도했습니다. Marco-O1의 전체 구조는 자체 플레이+MCT를 통해 반사 및 수정 기능을 갖춘 다수의 초대형 COT 데이터를 구축했으며 다른 오픈 소스 데이터와 함께 교육을 받았습니다. 연구팀은 또한 Marcopolo 제품군의 몇 가지 지침을 통합하여 데이터 세트를 따라 능력을 따르는 모델의 지침을 향상시켰다.
사용법 측면에서 연구팀은 추론 코드와 미세 조정 코드를 제공하여 모델과 워드 디바이저를 쉽게로드하고 채팅 또는 미세 조정 모델을 시작할 수 있습니다. 또한이 모델은 ModelScope의 GGUF 버전에서 직접 실행하여 더 빠른 경험을 제공 할 수 있습니다.
Marco-O1 모델의 출시는 추론 모델 분야의 Alibaba International AI 팀의 중요한 단계를 보여 주어 열린 문제를 해결하기위한 새로운 아이디어와 도구를 제공합니다.
modelscope :
https://modelscope.cn/models/aidc-ai/marco-e1
arxiv :
https://arxiv.org/abs/2411.14405
Github :
https://github.com/aidc-ai/marco-e1
포옹 얼굴 :
https://huggingface.co/aidc-jarco- o1
대체로 Marco-O1 모델의 오픈 소스는 AI 연구 및 응용 프로그램에 새로운 가능성을 제공하며, 열린 문제의 획기적인 가치는 기대할 가치가 있습니다. 관련 링크는 사용자 가이 모델을 더 이해하고 사용할 수 있도록 편리합니다.