Das Hangzhouer KI-Unternehmen DeepSeek hat sein neuestes groß angelegtes Sprachmodell V3 veröffentlicht, das zu geringen Kosten (5,6 Millionen US-Dollar) eine ähnliche Leistung wie GPT-4 von OpenAI und Claude 3.5Sonnet von Anthropic erzielt und damit die Aufmerksamkeit der Branche auf sich zieht. Dieser Erfolg unterstreicht die starken Forschungs- und Ingenieurskapazitäten von DeepSeek bei begrenzten Ressourcen und liefert auch neue Ideen für die Forschung und Entwicklung groß angelegter Sprachmodelle und stellt damit das traditionelle Konzept in Frage, dass hohe Investitionen hohe Renditen erzielen können. Der Erfolg des V3-Modells könnte auf weitere Möglichkeiten für die zukünftige Entwicklung im KI-Bereich hinweisen.
Vor kurzem hat DeepSeek, ein KI-Unternehmen mit Sitz in Hangzhou, sein neuestes groß angelegtes Sprachmodell V3 veröffentlicht. Die Leistung dieses Open-Source-Modells in mehreren Benchmark-Tests liegt nahe an der von 4o von OpenAI und Claude3.5Sonnet von Anthropic, was die Branche beeindruckt hat. Verglichen mit den Hunderten Millionen Dollar, die seine amerikanischen Kollegen investiert haben, betragen die Gesamtkosten des V3-Modells von DeepSeek nur 5,6 Millionen US-Dollar. Dieser enorme Unterschied ist auffällig.
Liang Wenfeng, CEO von DeepSeek, sagte, dass die Finanzierung für sie nie ein Problem gewesen sei. Obwohl V3 auf dem H800-Chip basiert, kann das DeepSeek-Team trotz begrenzter Ressourcen immer noch starke Forschungs- und Engineering-Fähigkeiten nachweisen.
Andrej Karpathy, ein Pionier auf dem Gebiet der KI, kommentierte, dass das Investitionsbudget von DeepSeek „was für ein Witz“ sei, das Endergebnis jedoch „höchst beeindruckende Forschung und Technik unter Ressourcenbeschränkungen“ sei.
AGI gilt als der „Heilige Gral“ der KI-Forschung, der in der Lage ist, den Menschen bei der Lösung von Problemen und der Ausführung von Aufgaben zu übertreffen. Einschlägige Experten sagen voraus, dass das erste Land, das AGI einführt, enorme wirtschaftliche, wissenschaftliche und sicherheitstechnische Vorteile haben wird.
Der Erfolg des DeepSeek V3-Modells beweist nicht nur, dass bahnbrechende Fortschritte zu geringen Kosten erzielt werden können, sondern, was noch wichtiger ist, es bietet eine neue Perspektive und Richtung für die globale KI-Forschung und -Entwicklung und bietet auch Möglichkeiten für Entwicklungsländer, mit fortgeschrittenen Schritten gleichzuziehen Ebenen im Bereich der künstlichen Intelligenz haben Hoffnung geweckt. In Zukunft könnten noch weitere ähnliche „Wunder“ geschehen.