Etched AI, sebuah perusahaan rintisan chip Amerika, baru-baru ini membuat terobosan besar, berhasil memasukkan arsitektur Transformer langsung ke dalam chip dan mengembangkan server pertama di dunia yang khusus dibuat untuk inferensi Transformer. Performa server ini jauh melebihi produk serupa dari NVIDIA, dapat menjalankan triliunan model parameter, dan memiliki banyak fungsi seperti agen suara real-time, pengkodean efisien dan pencarian pohon, decoding spekulatif multicast, dll. Juga dilengkapi dengan Memori bandwidth tinggi HBM3E 144GB. Inovasi ini diharapkan dapat sepenuhnya mengubah prospek penerapan arsitektur Transformer dan membawa perubahan revolusioner di bidang kecerdasan buatan.
Artikel ini berfokus pada:
Startup chip Amerika, Etched AI, berhasil memasukkan arsitektur Transformer langsung ke dalam chip, menciptakan server paling kuat di dunia yang didedikasikan untuk inferensi Transformer. Teknologi ini dapat menjalankan model dengan triliunan parameter, ratusan mil lebih maju dari Nvidia. Server ini memiliki banyak fitur, termasuk proxy suara real-time, kemampuan pengkodean dan pencarian pohon yang lebih baik, kemampuan decoding spekulatif multicast, dan dilengkapi dengan HBM3E 144GB. Terobosan teknologi ini akan membawa kemungkinan baru pada penerapan arsitektur Transformer.
Terobosan Etched AI ini menandai lompatan dalam bidang perangkat keras kecerdasan buatan. Performanya yang kuat dan fungsinya yang kaya akan membawa peningkatan signifikan pada banyak skenario aplikasi dan layak mendapatkan perhatian dan ekspektasi industri. Di masa depan, kita mungkin melihat lebih banyak aplikasi inovatif berdasarkan teknologi ini.