美国芯片初创公司Etched AI近日取得重大突破,成功将Transformer架构直接烧录到芯片中,研发出全球首款专为Transformer推理打造的服务器。该服务器性能远超英伟达同类产品,可运行万亿参数模型,并具备实时语音代理、高效编码与树搜索、多播推测解码等多项功能,还配备了144GB HBM3E高带宽内存。这一创新有望彻底改变Transformer架构的应用前景,为人工智能领域带来革命性变革。
文章划重点:
美国芯片初创公司Etched AI成功将Transformer架构直接烧录到芯片中,创造出了世界上最强大的专门用于Transformer推理的服务器。这项技术可以运行万亿参数的模型,甩英伟达几百条街。服务器具备多项功能,包括实时语音代理、更好的编码与树搜索能力、多播推测解码功能,并配备144GB HBM3E。这一突破性技术将为Transformer架构的应用带来新的可能性。
Etched AI的这一突破标志着人工智能硬件领域的一次飞跃,其强大的性能和丰富的功能将为众多应用场景带来显著提升,值得业界关注和期待。未来,我们或许将看到更多基于此技术的创新应用出现。