Alibaba Cloud が新しい数的推論モデル Qwen2.5-Math-PRM をリリース、バージョン 7B が GPT-4o を超える - AI 記事
本日、Alibaba Cloud Tongyi チームは、新しい数学的推論プロセス報酬モデル Qwen2.5-Math-PRM を正式にリリースしました。このモデルは 72B および 7B サイズで利用でき、そのパフォーマンスは、特に推論エラーの特定において、同様のオープンソースのプロセス報酬モデルよりも大幅に優れています。 Qwen2.5-Math-PRM
2025-01-26