Inländisches Open-Source-Großmodell DeepSeek R1 wird veröffentlicht, seine Leistung übertrifft das o1-Modell und die Kosten werden um 90 % gesenkt – AI-Artikel

Autor：Eve Cole Aktualisierungszeit：2025-01-28 13:00:02

Das vom chinesischen DeepSeek-Team als Open Source bereitgestellte große Modell R1 hat beeindruckende Vorteile in Bezug auf Leistung und Kosten gezeigt und große Aufmerksamkeit in der globalen Technologiegemeinschaft auf sich gezogen. Es hat das o1-Modell von OpenAI in vielen maßgeblichen Tests übertroffen, insbesondere in den Bereichen Mathematik und Programmierung. Es zeichnet sich durch seinen extrem geringen Kostenvorteil aus und ist zu einem dunklen Pferd im Bereich der großen Open-Source-Modelle geworden. Die offene Quelle von R1 demonstriert nicht nur Chinas Durchbruch im Bereich der Großmodelltechnologie, sondern verleiht der globalen KI-Entwicklung auch neue Dynamik.

Text: Kürzlich hat das chinesische DeepSeek-Team sein neuestes Open-Source-Großmodell R1 auf den Markt gebracht, das große Aufmerksamkeit erregt hat. Die Leistung des R1-Modells ist extrem gut und übertrifft das o1-Modell von OpenAI in vielen Tests, insbesondere bei Mathematik- und Programmierungsbewertungen.

Im letzten amerikanischen AIME2024-Test erzielte R1 79,8 Punkte und übertraf damit die 79,2 Punkte von o1. Im MATH-500-Test erzielte R1 97,3 Punkte und lag damit ebenfalls vor den 96,4 Punkten von o1. Darüber hinaus erzielte R1 im SWE-Bench-Verified-Test einen Wert von 49,2, was ebenfalls den Wert von o1 von 48,9 übertraf. Obwohl im Codetest Codeforces R1 nur 0,3 Punkte niedriger als o1 ist, entspricht die Gesamtleistung dem o1-Modell.

Neben der Leistung ist der Kostenvorteil von R1 noch auffälliger. Das o1-Modell von OpenAI hat eine Eingabegebühr von bis zu 15 US-Dollar pro 1 Million Token, während die Kosten für R1 nur 0,14 US-Dollar betragen, was einer Kostenreduzierung von 90 % entspricht. In Bezug auf den Output beträgt die Gebühr von o1 60 US-Dollar pro 1 Million Token, während R1 nur 2,19 US-Dollar kostet, was einer Reduzierung um das 27-fache entspricht. Dieser enorme Kostenunterschied hebt R1 im Bereich der Open-Source-Großmodelle hervor.

Nachdem das DeepSeek-Team bekannt gegeben hatte, dass R1 Open Source sei, äußerten viele ausländische Internetnutzer ihre Bewunderung für dieses Modell und glaubten, dass R1 etablierte Open-Source-Plattformen wie Meta und Mistral in Bezug auf Kostenleistung und Leistung übertreffen würde. Viele Leute sagen, dass das R1-Modell aufgrund seiner effizienten Argumentationsfähigkeiten hervorragend zum Schreiben von Code und für mathematische Erklärungen geeignet ist. Einige Benutzer nennen es sogar „das Modell, das dem menschlichen inneren Monolog am ähnlichsten ist“. Gleichzeitig testete Awni Hannun, Forscher für maschinelles Lernen bei Apple, auch R1 und stellte fest, dass es auf Apple M2Ultra schnell läuft und eine hohe Inferenzeffizienz aufweist.

Die Entwicklung des R1-Modells durchlief einen mehrstufigen Trainingsprozess, der Kaltstartdaten und mehrstufiges Training umfasste, um seine Inferenzfähigkeiten und Lesbarkeit zu verbessern. Diese technischen Verbesserungen gewährleisten die überlegene Leistung des R1-Modells bei einer Vielzahl von Aufgaben.

Mit der Veröffentlichung von R1 hat Chinas großes Open-Source-Modell erneut große Aufmerksamkeit und Diskussion auf dem internationalen Markt erregt, und viele Technologiebegeisterte haben Erwartungen an das Potenzial dieses Modells geäußert. Die Veröffentlichung von R1 markiert Chinas weiteren Durchbruch im Bereich der Großmodelltechnologie und fördert die Entwicklung der Open-Source-Technologie.

Open-Source-Adresse: https://huggingface.co/deepseek-ai/R1

API: https://api-docs.deepseek.com/guides/reasoning_model

Highlight:

Das R1-Modell übertraf in mehreren Tests das o1 von OpenAI und zeigte eine hervorragende Leistung.

Die Input- und Output-Kosten von R1 betragen nur 0,14 $ bzw. 2,19 $, was einer Kostenreduzierung von 90 % entspricht.

R1 hat große Aufmerksamkeit erhalten, seit es Open Source ist. Viele ausländische Experten lobten seine Leistung und waren davon überzeugt, dass es äußerst kostengünstig ist.

Das Aufkommen von R1 bietet Entwicklern nicht nur ein leistungsstarkes Tool mit hoher Leistung und niedrigen Kosten, sondern kündigt auch Chinas kontinuierliche Innovation und Verbesserung der Wettbewerbsfähigkeit im Bereich der künstlichen Intelligenz an. Wir freuen uns darauf, dass R1 in Zukunft in weiteren Bereichen Durchbrüche bringen wird.

​Inländisches Open-Source-Großmodell DeepSeek R1 wird veröffentlicht, seine Leistung übertrifft das o1-Modell und die Kosten werden um 90 % gesenkt – AI-Artikel

Inländisches Open-Source-Großmodell DeepSeek R1 wird veröffentlicht, seine Leistung übertrifft das o1-Modell und die Kosten werden um 90 % gesenkt – AI-Artikel