米国のチップ新興企業である Etched AI は、最近大きな進歩を遂げ、Transformer アーキテクチャをチップに直接焼き込むことに成功し、Transformer 推論専用に構築された世界初のサーバーの開発に成功しました。このサーバーのパフォーマンスは、NVIDIA の同様の製品をはるかに上回り、兆パラメータ モデルを実行でき、リアルタイム音声エージェント、効率的なエンコードとツリー検索、マルチキャスト投機的デコードなどの多くの機能も備えています。 144GB HBM3E 高帯域幅メモリ。このイノベーションは、Transformer アーキテクチャのアプリケーションの見通しを完全に変え、人工知能の分野に革命的な変化をもたらすことが期待されています。
この記事では次の点に焦点を当てています。
アメリカのチップスタートアップ Etched AI は、Transformer アーキテクチャをチップに直接焼き込むことに成功し、Transformer 推論専用の世界で最も強力なサーバーを作成しました。このテクノロジーは、Nvidia よりも数百マイルも進んで、数兆のパラメーターを含むモデルを実行できます。このサーバーには、リアルタイム音声プロキシ、より優れたエンコードおよびツリー検索機能、マルチキャスト投機的デコード機能などの複数の機能があり、144 GB HBM3E が搭載されています。この画期的なテクノロジーは、Transformer アーキテクチャのアプリケーションに新たな可能性をもたらします。
Etched AI のこの画期的な進歩は、人工知能ハードウェアの分野における飛躍を示し、その強力なパフォーマンスと豊富な機能は、多くのアプリケーション シナリオに大幅な改善をもたらし、業界の注目と期待に値します。将来的には、このテクノロジーに基づいたさらに革新的なアプリケーションが登場する可能性があります。