Kürzlich veröffentlichte SemiAnalysis einen Bericht, in dem es heißt, dass die Software des KI-Chips MI300X der neuen Generation von AMD schwerwiegende Mängel aufweist, die verhindern, dass seine Leistung vollständig ausgeschöpft wird und Nvidias Dominanz auf dem KI-Chip-Markt nicht wirksam herausgefordert werden kann. Der Bericht, der auf einer fünfmonatigen eingehenden Untersuchung basiert, deckt die Mängel von AMD beim Aufbau des Software-Ökosystems auf und gibt Empfehlungen für die zukünftige Entwicklung von AMD.
Kürzlich veröffentlichte die Technologieanalyseagentur SemiAnalysis einen fünfmonatigen Untersuchungsbericht, aus dem hervorgeht, dass der neueste AI-Chip MI300X von AMD erhebliche Softwareprobleme aufweist, die dazu führen, dass er nicht die erwartete Leistung erbringt und daher nicht auf dem AI-Chip-Markt konkurrieren kann . Nvidias Dominanz herausfordern.
Der Bericht wies darauf hin, dass die Software von AMD eine große Anzahl von Schwachstellen enthält, die das Training von KI-Modellen nahezu unmöglich machen und Benutzer viel Zeit mit der Fehlerbehebung verbringen müssen. Unterdessen führt Nvidia weiterhin neue Funktionen, Bibliotheken und Leistungsupdates ein, die die Kluft zwischen beiden noch weiter vergrößern. Analysten führten umfangreiche Tests durch, darunter GEMM-Benchmarks und Einzelknotentraining. Die Ergebnisse zeigten, dass AMD den sogenannten „CUDA-Wassergraben“ – also Nvidias starken Softwarevorteil – nicht überwinden konnte.
Aus Sicht der Hardware-Spezifikationen sind die Leistungsdaten des MI300X durchaus auffällig. Die FP16-Rechenleistung erreicht 1307 TeraFLOPS und ist mit 192 GB HBM3-Speicher ausgestattet. Im Vergleich dazu verfügt Nvidias H100 über 989 TeraFLOPS und 80 GB Speicher, obwohl Nvidias neuestes H200 die Lücke in Sachen Speicher schließt und eine 141-GB-Konfiguration bietet. Erwähnenswert ist, dass AMD-Systeme Vorteile hinsichtlich der Gesamtbetriebskosten bieten, mit niedrigeren Preisen und günstigeren Ethernet-Netzwerken.
Allerdings bringen diese Hardware-Vorteile im tatsächlichen Einsatz nicht die gewünschten Ergebnisse. SemiAnalysis beschreibt dieses Phänomen als „Vergleich von Kameras allein anhand der Pixelzahl“, was darauf hindeutet, dass AMD sich im Zahlenspiel verliert und nicht genügend reale Leistung liefert. Um brauchbare Benchmark-Ergebnisse zu erhalten, mussten Analysten direkt mit AMD-Ingenieuren zusammenarbeiten, um mehrere Software-Schwachstellen zu beheben, während Nvidias System ohne zusätzliche Optimierungen einsatzbereit war.
In dem Bericht wurde auch erwähnt, dass Tensorwave, AMDs größter GPU-Cloud-Dienstleister, dem AMD-Team sogar seine eigenen gekauften GPUs kostenlos zur Verfügung stellen musste, um bei der Lösung von Softwareproblemen zu helfen. Zu diesem Zweck schlug SemiAnalysis vor, dass AMD-CEO Su Zifeng die Investitionen in Softwareentwicklung und -tests erhöhen muss, insbesondere durch die Bereitstellung einer großen Anzahl von MI300X-Chips für automatisierte Tests, die Vereinfachung komplexer Umgebungsvariablen und die Verbesserung der Standardeinstellungen, um das Werkserlebnis zu verbessern.
Obwohl SemiAnalysis hofft, dass AMD ein starker Konkurrent von Nvidia werden kann, sagten sie auch, dass „leider noch viel Arbeit vor uns liegt“. Ohne größere Softwareverbesserungen besteht die Gefahr, dass AMD weiter zurückfällt, insbesondere da Nvidia sich auf die Einführung seiner nächsten Generation von Blackwell-Chips vorbereitet, obwohl es auch Berichte gibt, dass Nvidias Produkteinführung der nächsten Generation nicht reibungslos verlaufen wird.
Höhepunkte:
Der AMD MI300X AI-Chip weist schwerwiegende Softwareprobleme auf, die das Training des AI-Modells erschweren.
Nvidia baut seinen Marktvorteil mit seiner leistungsstarken CUDA-Plattform und häufigen Software-Updates weiter aus.
SemiAnalysis empfiehlt AMD, die Investitionen in die Softwareentwicklung zu erhöhen und das Benutzererlebnis zu verbessern, um die Wettbewerbsfähigkeit zu steigern.
Alles in allem zeigt der Bericht deutlich die enormen Softwareherausforderungen auf, mit denen AMDs MI300X-Chips konfrontiert sind, und die Richtungen, in denen AMD sich verbessern muss. Ob es den „Wassergraben“ in der Software überwinden kann, wird direkt über den Erfolg oder Misserfolg von AMD im zukünftigen Wettbewerb auf dem Markt für KI-Chips entscheiden.