Alibaba Cloud запустила серию Qwen2-Math, новую крупномасштабную языковую модель, ориентированную на область математики, которая привлекла широкое внимание в отрасли. Эта серия моделей превосходит существующие модели с открытым исходным кодом в многочисленных математических тестах производительности и даже превосходит известные модели с закрытым исходным кодом, такие как GPT-4o и Claude-3.5-Sonnet, в некоторых аспектах. Редактор Downcodes даст вам подробное объяснение превосходной производительности, инновационных технологий и направления будущего развития моделей серии Qwen2-Math, а также познакомит вас с последними достижениями в области математики искусственного интеллекта.
Недавно Alibaba Cloud запустила серию крупномасштабных языковых моделей Qwen2-Math. Этот новичок в области искусственного интеллекта, ориентированный на область математики, сразу же после своего представления привлек широкое внимание в отрасли.
Модели Qwen2-Math и Qwen2-Math-Instruct-1.5B/7B/72B, последние представители серии Qwen2, продемонстрировали впечатляющие возможности решения математических задач. Сообщается, что эта серия моделей не только превзошла существующие модели с открытым исходным кодом в нескольких математических тестах производительности, но и превзошла по некоторым аспектам, включая GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro и Llama-Well- известные модели с закрытым исходным кодом, в том числе 3.1-405B, можно назвать темными лошадками в математическом сообществе ИИ.
Успех Qwen2-Math не случаен. В прошлом году команда Alibaba Cloud посвятила много усилий улучшению возможностей рассуждения больших языковых моделей для решения арифметических и математических задач. Основой этой серии моделей является Qwen2-1.5B/7B/72B. На этой основе группа исследований и разработок провела углубленное предварительное обучение с использованием тщательно разработанного профессионального математического корпуса. Этот уникальный корпус охватывает масштабные и высококачественные онлайн-тексты по математике, профессиональные книги, примеры кода и масштабные экзаменационные вопросы и даже включает данные для предварительной подготовки по математике, независимо сгенерированные Qwen2.
Особо стоит упомянуть модель Qwen2-Math-Instruct. Эта модель вознаграждения профессиональных математиков, основанная на обучении Qwen2-Math-72B, использует инновационный метод обучения. Группа исследований и разработок умело объединяет сигнал плотного вознаграждения с двоичным сигналом о том, правильно ли отвечает модель или нет. Этот комбинированный сигнал используется в качестве контрольного сигнала для построения данных SFT (контролируемой точной настройки) посредством выборки отклонения, а также в обучении с подкреплением. после применения технологии относительной оптимизации политики (GRPO) SFT Group. Этот уникальный метод обучения значительно улучшает возможности модели по решению математических задач.
В практических приложениях Qwen2-Math-Instruct показывает потрясающую производительность. Будь то AIME (Американский пригласительный экзамен по математике) 2024 года или AMC (Американское соревнование по математике) 2023 года, эта модель хорошо зарекомендовала себя в различных условиях, включая жадный поиск (Жадный), голосование большинством, минимизацию риска и другие стратегии.
Что еще более интересно, так это то, что Qwen2-Math также показала большую эффективность в решении некоторых задач уровня Международной математической олимпиады (IMO). Проанализировав серию тестовых примеров, исследователи обнаружили, что Qwen2-Math может не только легко решать простые задачи по математике, но и предоставлять убедительные решения при столкновении со сложными задачами.
Однако команда Alibaba Cloud на этом не остановилась. Они сообщили, что текущая серия Qwen2-Math поддерживает только английский язык, но они уже активно разрабатывают двуязычные модели, поддерживающие английский и китайский языки, и планируют запустить многоязычные версии в ближайшем будущем. Кроме того, команда продолжает оптимизировать модель, чтобы улучшить ее способность решать более сложные математические задачи.
Появление Qwen2-Math, несомненно, открыло новые возможности для применения ИИ в области математики. Оно не только внесет революционные изменения в индустрию образования и поможет студентам лучше понять и освоить математические знания, но также может сыграть важную роль в научных исследованиях, инженерии и других областях, требующих сложных математических расчетов.
Страница проекта: https://top.aibase.com/tool/qwen2-math
Загрузка модели: https://huggingface.co/Qwen
В целом, появление серии моделей Qwen2-Math знаменует собой крупный прорыв для ИИ в области математики. Его будущий потенциал развития огромен и заслуживает постоянного внимания. Редактор Downcodes считает, что благодаря постоянному развитию технологий Qwen2-Math откроет больше возможностей для математического образования и научных исследований.