DeepSeek, eine Tochtergesellschaft des chinesischen quantitativen Investmentriesen Huifang Quantitative, hat kürzlich sein neuestes inferenzorientiertes, groß angelegtes Sprachmodell R1-Lite-Preview veröffentlicht. Dieses Modell ist derzeit nur für die Öffentlichkeit über die Web-Chatbot-Plattform DeepSeek Chat verfügbar. R1-Lite-Preview verwendet „Kettendenken“-Argumentation, die den Denkprozess zeigen kann, den es bei der Beantwortung von Benutzeranfragen durchläuft. Auch wenn einige Denkketten unsinnig erscheinen, ist die allgemeine Antwortgenauigkeit sehr hoch und es kann sogar einige traditionelle Probleme lösen . Probleme, die für leistungsstarke KI-Modelle schwer zu bewältigen sind. Das Modell übertraf das kürzlich veröffentlichte o1-preview-Modell von OpenAI in mehreren Benchmark-Tests und seine Leistung ist hervorragend bei Aufgaben, die logisches Denken, mathematisches Denken und Problemlösung in Echtzeit erfordern.
DeepSeek ist für seine innovativen Beiträge zum Open-Source-KI-Ökosystem bekannt. Diese neue Version zielt darauf ab, der Öffentlichkeit hochrangige Inferenzfunktionen zur Verfügung zu stellen und gleichzeitig das Engagement für Zugänglichkeit und Transparenz aufrechtzuerhalten. Obwohl R1-Lite-Preview derzeit nur in Chat-Anwendungen verfügbar ist, hat es mit einer Leistung, die dem kürzlich veröffentlichten o1-Preview-Modell von OpenAI nahekommt oder es sogar übertrifft, viel Aufmerksamkeit auf sich gezogen. R1-Lite-Preview nutzt die Argumentation „Kettendenken“, die die unterschiedlichen Denkprozesse aufzeigen kann, die es bei der Beantwortung von Benutzeranfragen durchläuft.
Obwohl einige Gedankenketten für Menschen unsinnig oder falsch erscheinen mögen, sind die Antworten von R1-Lite-Preview insgesamt sehr genau und können sogar die „Fallen“ lösen, auf die einige traditionelle leistungsstarke KI-Modelle wie GPT-4o und die Claude-Serie stoßen. Wie viele R hat das Wort „Erdbeere“? „Was ist größer, 9,11 oder 9,9?“
Laut DeepSeek zeichnet sich das Modell bei Aufgaben aus, die logisches Denken, mathematisches Denken und Problemlösung in Echtzeit erfordern. Seine Leistung übertrifft das Niveau von OpenAI o1-preview bei etablierten Benchmarks wie AIME (American Invitational Mathematics Examination) und MATH.
Darüber hinaus veröffentlichte DeepSeek erweiterte Daten für das Modell, die eine stetige Verbesserung der Genauigkeit belegen, wenn dem Modell mehr Zeit oder „Denk-Tokens“ zur Lösung des Problems gegeben wird. Die Grafik verdeutlicht, dass sich die Punktzahl des Modells bei Benchmarks wie AIME mit zunehmender Denktiefe verbessert.
Die aktuelle Version von R1-Lite-Preview schneidet in wichtigen Benchmarks gut ab und ist in der Lage, eine Reihe von Aufgaben von komplexer Mathematik bis hin zu Logikszenarien zu bewältigen, wobei die Ergebnisse mit Top-Inferenzmodellen wie GPQA und Codeforces vergleichbar sind. Der transparente Argumentationsprozess des Modells ermöglicht es Benutzern, seine logischen Schritte in Echtzeit zu beobachten, was das Verantwortungsbewusstsein und die Glaubwürdigkeit des Systems stärkt.
Es ist erwähnenswert, dass DeepSeek weder den vollständigen Code für unabhängige Analysen oder Benchmarking durch Dritte veröffentlicht hat, noch eine API-Schnittstelle für unabhängige Tests bereitgestellt hat. Das Unternehmen hat keine relevanten Blog-Beiträge oder technischen Dokumente veröffentlicht, die das Training oder Testen von R1 erläutern -Lite-Preview-Struktur, die den Ursprung dahinter immer noch voller Zweifel macht.
R1-Lite-Preview ist derzeit kostenlos über DeepSeek Chat (chat.deepseek.com) verfügbar, der erweiterte „Deep“-Modus ist jedoch auf 50 Nachrichten pro Tag begrenzt, sodass Benutzer seine leistungsstarken Funktionen erleben können. DeepSeek plant die Veröffentlichung von Open-Source-Versionen der Modelle der R1-Serie und zugehörigen APIs, um die Entwicklung der Open-Source-KI-Community weiter zu unterstützen.
DeepSeek treibt weiterhin Innovationen im Open-Source-KI-Bereich voran und die Veröffentlichung von R1-Lite-Preview fügt seiner Inferenz und Skalierbarkeit eine neue Dimension hinzu. Während Unternehmen und Forscher Anwendungen für inferenzintensive KI erforschen, wird DeepSeeks Engagement für Offenheit sicherstellen, dass seine Modelle zu einer wichtigen Ressource für Entwicklung und Innovation werden.
Offizieller Eingang: https://www.deepseek.com/
Highlight:
DeepSeek veröffentlicht das R1-Lite-Preview-Modell, dessen Leistung nahe an OpenAI o1 liegt und diese sogar übertrifft.
Das Modell stellt einen transparenten Denkprozess dar und Benutzer können die logischen Schritte in Echtzeit beobachten.
Es verfügt über bemerkenswerte Deep-Learning- und logische Denkfähigkeiten und eine Open-Source-Version und API werden in Zukunft veröffentlicht.
Alles in allem zeigt das von DeepSeek veröffentlichte R1-Lite-Preview-Modell erhebliche Vorteile bei den Inferenzfähigkeiten, und auch sein transparenter Inferenzprozess und zukünftige Open-Source-Pläne sind eine Vorfreude wert. Der derzeitige Mangel an öffentlichem Code und technischer Dokumentation schränkt jedoch eine umfassende Bewertung seiner Leistung ein.