Das mathematische Modell Qwen2 Math Demo von Tongyi Qianwen wird veröffentlicht, die 72B-Version übertrifft GPT-4

Autor：Eve Cole Aktualisierungszeit：2024-12-22 14:16:01

Das Team von Alibaba Tongyi Qianwen veröffentlichte das erstaunliche mathematische Modell Qwen2-Math. Seine Leistung übertraf in mehreren Benchmark-Tests die 72B-Parameterversion des Open-Source-Modells NuminaMath. Dieses Modell kann nicht nur mathematische Probleme lösen, die per Text eingegeben werden, sondern erkennt auch Formeln in Bildern und Screenshots, was es zu einem leistungsstarken Hilfsmittel für das Mathematiklernen macht. Verschiedene Versionen (72B, 7B und 1.5B) bieten Optionen für unterschiedliche Anforderungen und zeichnen sich durch starke Leistung und Anpassungsfähigkeit aus.

Das Tongyi Qianwen-Team von Alibaba hat gerade die Qwen2Math-Demo veröffentlicht. Dieses mathematische Modell ist einfach ein kleines Monster, selbst GPT-4 wird mit Füßen getreten.

Dieses Modell kann nicht nur mathematische Probleme der Texteingabe bewältigen, sondern auch Formeln in Bildern und Screenshots verstehen. Stellen Sie sich vor, Sie machen ein Foto von einer Rechnung und es kann Ihnen die Antwort geben. Es ist einfach ein Hilfsmittel zur Lösung von Problemen im Mathematikunterricht. (Natürlich befürworten wir kein Schummeln.)

Qwen2-Math wird in drei Versionen veröffentlicht: 72B, 7B und 1.5B. Unter ihnen ist Version 72B einfach ein mathematisches Genie. Sie erzielte im MATH-Datensatz tatsächlich 7 Punkte mehr als GPT-4, was einer Steigerung von 9,6 % entspricht. Das ist so, als hätten Sie im Mathematiktest für die Hochschulaufnahmeprüfung 145 Punkte erreicht, aber der beste Student neben Ihnen hat nur 132 Punkte erreicht.

Noch erstaunlicher ist, dass die 7B-Version weniger als ein Zehntel der Parameter verwendet und damit das 72B Open-Source-Mathematikmodell NuminaMath übertrifft. Wissen Sie, NuminaMath ist das Modell, das den Preis beim weltweit ersten AIMO gewonnen hat, und der Preis wurde persönlich von Terence Tao, der Top-Persönlichkeit in der Welt der Mathematik, überreicht.

Lin Junyang, Alibabas leitender Algorithmusexperte, gab begeistert bekannt, dass sie das Qwen2-Modell in einen mathematischen Meister verwandelt haben. Wie haben sie das gemacht? Sie verwendeten eine spezielle mathematische Gehirnergänzung – ein sorgfältig entworfenes mathematikspezifisches Korpus. Diese Gehirnergänzung enthält eine große Anzahl hochwertiger Mathematik-Online-Texte, Bücher, Codes, Prüfungsfragen und sogar Mathematikfragen, die nach dem Qwen2-Modell zusammengestellt wurden.

Das Ergebnis? Bei den klassischen Mathematik-Testsätzen wie GSM8K und MATH hat Qwen2-Math-72B den 405B Llama-3.1 hinter sich gelassen. Diese Testsätze sind kein Scherz. Sie enthalten verschiedene mathematische Probleme wie Algebra, Geometrie, Wahrscheinlichkeit und Zahlentheorie.

Darüber hinaus stellte Qwen2-Math auch den chinesischen Datensatz CMATH und Fragen zur Hochschulaufnahmeprüfung in Frage. Im chinesischen Datensatz kann sogar die 1,5B-Version die 70B-Llama3.1 schlagen. Darüber hinaus wurde die Leistung unabhängig von der Version im Vergleich zum Qwen2-Basismodell im gleichen Maßstab deutlich verbessert.

Es scheint, dass Tongyi Qianwen dieses Mal wirklich ein Mathe-Genie gefragt hat! Aber denken Sie daran, dies ist nur ein Werkzeug, lassen Sie sich nicht von seiner Intelligenz täuschen, Sie müssen noch üben deine Mathekenntnisse!

Online-Erlebnisadresse: https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo

Das Aufkommen von Qwen2-Math markiert einen bedeutenden Fortschritt bei groß angelegten Sprachmodellen im Bereich der Mathematik. Obwohl es sich um ein leistungsstarkes Werkzeug handelt, ist es wichtiger, die eigenen mathematischen Fähigkeiten zu entwickeln und sich niemals auf das Werkzeug zu verlassen und den Lernprozess zu ignorieren. Wir freuen uns darauf, dass Qwen2-Math in Zukunft in weiteren Bereichen eine Rolle spielen und das Lernen und die wissenschaftliche Forschung komfortabler gestalten kann.