Musk kündigte den offiziellen Start des weltweit „stärksten“ KI-Trainingsclusters an, das mit 100.000 H100 ausgestattet ist

Autor：Eve Cole Aktualisierungszeit：2024-12-05 20:16:01

Downcodes-Editorberichte: Musks xAI-Unternehmen gab kürzlich bekannt, dass es den weltweit leistungsstärksten KI-Trainingscluster einsetzt – den „Memphis Super Cluster“ in Memphis, Tennessee. Der Cluster verfügt über 100.000 flüssigkeitsgekühlte Nvidia H100-GPUs und nutzt RDMA-Technologie zur Optimierung der Datenübertragung mit dem Ziel, das leistungsstärkste KI-Modell zu schaffen. Dieser Schritt hat in der Branche große Aufmerksamkeit erregt und den harten Wettbewerb im KI-Bereich deutlich gemacht. Das Ziel von xAI besteht darin, die Ausbildung bis Dezember 2024 abzuschließen. Angesichts des Fortschritts von Musks früheren Projekten besteht jedoch weiterhin Unsicherheit darüber, ob dieses Ziel erreicht werden kann.

Lokalen Nachrichtenberichten zufolge ist der Supercluster mit 100.000 flüssigkeitsgekühlten Nvidia H100-Grafikprozessoren (GPUs) ausgestattet. Diese Chips werden seit letztem Jahr auf den Markt gebracht und die Marktnachfrage ist so groß, dass sogar der Konkurrent OpenAI diese Geräte verwendet. Musk erwähnte außerdem, dass der gesamte Cluster beim Betrieb eine Technologie namens „Remote Direct Memory Access“ (RDMA) nutzt, die Daten effizient zwischen Rechenknoten übertragen und die Arbeitslast der Zentraleinheit (CPU) reduzieren kann.

Das Ziel von xAI ist es, bis Dezember 2024 durch diesen Supercluster „die leistungsstärkste KI in allen Indikatoren“ zu trainieren. In seiner Antwort betonte Musk, dass der Memphis-Supercluster „erhebliche Vorteile“ für ihre Ziele bringen würde. Angesichts der Verzögerungen von Musk in der Vergangenheit bei mehreren Projekten sind viele jedoch vorsichtig, dieses Versprechen einzulösen.

Tatsächlich sind die Konkurrenten von xAI nicht untätig. Unternehmen wie OpenAI, Anthropic, Google, Microsoft und Meta beeilen sich, leistungsfähigere und erschwinglichere Large Language Models (LLM) und Small Language Models (SLM) einzuführen. Daher benötigt xAI innovative und praktische neue Modelle, um in diesem Wettbewerb der künstlichen Intelligenz Fuß zu fassen.

Darüber hinaus gaben mit der Angelegenheit vertraute Personen bekannt, dass Microsoft mit OpenAI-CEO Sam Altman an der Entwicklung eines 100 Milliarden US-Dollar teuren KI-Trainings-Supercomputers mit dem Codenamen „Stargate“ arbeitet. Wenn dieser Plan umgesetzt wird, bleibt der Memphis-Supercluster von xAI möglicherweise nicht der leistungsstärkste der Welt.

Highlight:

xAI kündigte die Einführung des weltweit leistungsstärksten KI-Trainingsclusters an, ausgestattet mit 100.000 Nvidia H100-GPUs.

Musk plant, bis Dezember 2024 die „leistungsfähigste KI“ zu trainieren, und sagte, Cluster würden erhebliche Vorteile bieten.

xAI steht unter dem Druck von Konkurrenten wie OpenAI und Google und muss innovative Modelle auf den Markt bringen, um wettbewerbsfähig zu bleiben.

Die Fertigstellung des Memphis-Superclusters markiert eine neue Etappe im Wettbewerb um KI-Rechenleistung. Ob xAI seine Ziele erreichen kann, das Endergebnis muss noch getestet werden. Der letztendliche Nutznießer dieses KI-Wettrüstens wird die gesamte Menschheit sein. Warten wir ab!