Baru-baru ini, SemiAnalysis merilis laporan yang menyatakan bahwa terdapat kelemahan serius pada perangkat lunak chip AI generasi baru AMD MI300X, yang membuat kinerjanya tidak terwujud sepenuhnya dan tidak mampu secara efektif menantang dominasi Nvidia di pasar chip AI. Laporan tersebut, berdasarkan investigasi mendalam selama lima bulan, mengungkap kekurangan AMD dalam konstruksi ekosistem perangkat lunak dan membuat rekomendasi untuk pengembangan AMD di masa depan.
Baru-baru ini, lembaga analisis teknologi SemiAnalysis merilis laporan investigasi lima bulan, mengungkapkan bahwa chip AI MI300X terbaru AMD memiliki masalah perangkat lunak yang besar, menyebabkannya tidak dapat berfungsi sebagaimana mestinya, dan oleh karena itu tidak mampu bersaing di pasar chip AI. .Menantang dominasi Nvidia.
Laporan tersebut menunjukkan bahwa perangkat lunak AMD mengandung sejumlah besar kerentanan, membuat pelatihan model AI hampir tidak mungkin dilakukan dan pengguna perlu menghabiskan banyak waktu untuk melakukan debug. Sementara itu, Nvidia terus meluncurkan fitur, perpustakaan, dan pembaruan kinerja baru yang semakin memperlebar kesenjangan di antara keduanya. Analis melakukan pengujian ekstensif, termasuk benchmark GEMM dan pelatihan node tunggal, dan hasilnya menunjukkan bahwa AMD tidak mampu mengatasi apa yang disebut "parit CUDA" - yaitu, keunggulan kuat Nvidia dalam perangkat lunak.
Dari segi spesifikasi hardware, data performa MI300X cukup memukau. Daya komputasi FP16 mencapai 1307TeraFLOPS dan dibekali memori HBM3 sebesar 192GB. Sebagai perbandingan, Nvidia H100 memiliki 989 TeraFLOPS dan memori 80GB, meskipun H200 terbaru Nvidia menutup kesenjangan dalam hal memori, menawarkan konfigurasi 141GB. Perlu disebutkan bahwa sistem AMD menawarkan keunggulan dalam hal total biaya kepemilikan, dengan harga lebih rendah dan jaringan Ethernet lebih terjangkau.
Namun, keunggulan perangkat keras ini tidak memberikan hasil yang diinginkan dalam penggunaan sebenarnya. SemiAnalysis menggambarkan fenomena ini sebagai "membandingkan kamera berdasarkan jumlah piksel saja," menunjukkan bahwa AMD tersesat dalam permainan angka dan gagal memberikan kinerja yang cukup di dunia nyata. Untuk mendapatkan hasil benchmark yang dapat digunakan, analis harus bekerja secara langsung dengan para insinyur AMD untuk mengatasi berbagai kerentanan perangkat lunak, sedangkan sistem Nvidia siap digunakan tanpa penyesuaian tambahan.
Laporan tersebut juga menyebutkan bahwa Tensorwave, penyedia layanan cloud GPU terbesar AMD, bahkan harus memberikan GPU yang dibelinya sendiri kepada tim AMD secara gratis untuk membantu menyelesaikan masalah perangkat lunak. Untuk mencapai tujuan ini, SemiAnalysis menyarankan agar CEO AMD Su Zifeng perlu meningkatkan investasi dalam pengembangan dan pengujian perangkat lunak, terutama mengalokasikan sejumlah besar chip MI300X untuk pengujian otomatis, menyederhanakan variabel lingkungan yang kompleks, dan meningkatkan pengaturan default untuk meningkatkan pengalaman pabrik.
Meski SemiAnalysis berharap AMD bisa menjadi pesaing kuat Nvidia, mereka juga mengatakan bahwa "sayangnya, masih banyak pekerjaan yang harus diselesaikan." Tanpa perbaikan perangkat lunak yang besar, AMD berisiko semakin tertinggal, terutama karena Nvidia bersiap meluncurkan chip Blackwell generasi berikutnya, meskipun ada juga laporan bahwa peluncuran produk Nvidia generasi berikutnya tidak akan berjalan mulus.
Highlight:
Chip AI AMD MI300X menghadapi masalah perangkat lunak yang serius, sehingga membuat pelatihan model AI menjadi sulit.
Nvidia terus memperluas keunggulan pasarnya dengan platform CUDA yang kuat dan pembaruan perangkat lunak yang sering dilakukan.
SemiAnalysis merekomendasikan agar AMD meningkatkan investasi dalam pengembangan perangkat lunak dan meningkatkan pengalaman pengguna untuk meningkatkan daya saing.
Secara keseluruhan, laporan ini dengan jelas menunjukkan tantangan perangkat lunak besar yang dihadapi oleh chip MI300X AMD dan arah yang perlu ditingkatkan oleh AMD. Apakah AMD dapat mengatasi "parit" dalam perangkat lunak akan secara langsung menentukan keberhasilan atau kegagalan AMD dalam persaingan pasar chip AI di masa depan.