Последняя технология Microsoft RSTAR-Math знаменует собой серьезный прорыв в искусственном интеллекте в области математических рассуждений. Эта инновационная технология разработана специально для моделей малых языков (SLM), а с помощью уникальных методов вывода значительно расширяют возможности этих моделей в решении сложных математических задач. В нескольких тестах технология RSTAR-MATH не только значительно улучшает производительность нескольких моделей с открытым исходным кодом, но даже превосходит модель Openai O1 в конкретных сценариях.
Ядро технологии RSTAR-Math заключается в его инновационном приложении Monte Carlo Search Tree (MCTS). Этот метод имитирует процесс глубокого мышления человека, помогая малым языковым моделям в достижении самоволюции, постепенно совершенствуя и оптимизируя решения математических задач. Исследовательская группа не только попросила модель вывести окончательный ответ, но и попросила ее предоставить подробные шаги вывода естественного языка и соответствующий код Python.
В конкретных тестах технология RSTAR-MATH применяется к нескольким известным моделям с открытым исходным кодом, включая Microsoft Mini Mini Phi-3, модели Alibaba QWEN-1,5B и QWEN-7B. Результаты теста показывают, что все модели, участвующие в тесте, выполняемые значительно в математическом этапе. Особенно стоит упомянуть, что после применения технологии RSTAR-MATH уровень точности модели QWEN2,5-MATH-7B подскочил с 58,8% до 90,0%. . Огромный потенциал моделей в определенных областях.
Исследовательская группа планирует раскрыть соответствующий код и данные о GitHub, и это решение широко приветствовалось сообществом ИИ. Многие эксперты считают, что комбинация технологии RSTAR-Math и поиска дерева Монте-Карло, особенно применение в таких областях, как геометрическое доказательство и символические рассуждения, будет способствовать развитию искусственного интеллекта в полях, связанных с математикой. Этот пошаговый метод рассуждения не только повышает точность модели, но и обеспечивает новые направления для будущих исследований.
Успех технологии RSTAR-Math также вызвал отражение на текущей модели развития искусственного интеллекта. В последние годы инновации в области искусственного интеллекта в основном опирались на постоянное увеличение параметров модели. Microsoft демонстрирует потенциал небольших моделей с технологией RSTAR-Math, предоставляя новые варианты для организаций среднего размера и академических исследователей, чтобы получить передовые возможности ИИ без необходимости нести огромные затраты.
В конкретных сценариях применения технология RSTAR-Math показала замечательные результаты. В тесте American Mathematic Invitational (AIME) модель с использованием технологии RSTAR-Math решила 53,3% проблем, что эквивалентно лучшим 20% участников старших классов. Это достижение не только доказывает эффективность этой технологии в практических приложениях, но также предоставляет возможности для будущих приложений в области образования.
Документ, совместно завершенный восьми исследователями из Microsoft, Peking University и Tsinghua University, была опубликована на arxiv.org, предоставляя подробные технические детали и экспериментальные данные для академической и промышленности. Ожидается, что с предстоящим раскрытием кода и данных он привлечет больше исследователей, чтобы присоединиться к этой области, способствуя дальнейшему развитию и улучшению технологии RSTAR-Math.
Запуск технологии RSTAR-Math не только демонстрирует огромный потенциал малых языковых моделей в определенных задачах, но также предоставляет новые идеи для развития искусственного интеллекта. При проведении более крупных моделей, как повысить производительность небольших моделей с помощью технологических инноваций, станет одним из важных направлений в будущих исследованиях ИИ. Успех этой технологии может вызвать новый раунд технологических соревнований и способствовать развитию всей отрасли в более эффективном и устойчивом направлении.