Alibaba Cloud, 새로운 수학적 추론 모델 Qwen2.5-Math-PRM 출시, 버전 7B가 GPT-4o를 능가 - AI 기사
오늘 Alibaba Cloud Tongyi 팀은 새로운 수학적 추론 프로세스 보상 모델 Qwen2.5-Math-PRM을 공식 출시했습니다. 이 모델은 72B 및 7B 크기로 제공되며 특히 추론 오류 식별 측면에서 유사한 오픈 소스 프로세스 보상 모델보다 성능이 훨씬 뛰어납니다. Qwen2.5-Math-PRM
2025-01-26