このプロジェクトはインテルによって維持されなくなります。
インテルは、このプロジェクトに対する開発と、メンテナンス、バグ修正、新しいリリース、またはアップデートを含むがこれらに限定されない貢献を中止しました。
インテルはこのプロジェクトへのパッチを受け付けなくなりました。
このプロジェクトを継続的に使用する必要がある場合、独自に開発することに興味がある場合、またはオープン ソース ソフトウェア コミュニティ用のパッチを保守したい場合は、このプロジェクトの独自のフォークを作成してください。
インテル® Xeon® スケーラブル・プロセッサー Max シリーズおよび第 4 世代インテル® Xeon® スケーラブル・プロセッサー上のインテル® アドバンスト・マトリックス・エクステンション (インテル® AMX) 機能を示すコードサンプル。
インテル® AMX では、行列を処理するための x86 命令セット アーキテクチャ (ISA) への新しい拡張機能が導入され、AI ワークロードでの行列乗算が高速化される可能性があります。これは 2 つのコンポーネントで構成されます。
このコード サンプルは、組み込み関数を使用して新しい命令をテストする方法を示しています。
このサンプルのコードのウォークスルーは、https://www.intel.com/content/www/us/en/developer/articles/code-sample/advanced-matrix-extensions-intrinsics-functions.html にあります。
コード サンプルは、INT8 値を含むサイズ 16 x 64 の行列 A と B を乗算し、その結果を INT32 値を含む 16 x 16 行列 C に累積します。
このコード サンプルは、新しいインテル(R) AMX 命令の使用を強調するために簡略化されています。ここでは、タイルの構成、メモリからタイルへのデータのロード、タイル データに対する 1 つの行列乗算の実行、およびタイルからメモリへの結果のコピーを行うための命令の使用法を示します。製品コードのベースとして使用しないでください。デモ目的のみ。
このコード サンプルは、MIT ライセンスに基づいてライセンスされています。
test-amxtile
実行可能ファイルのビルド次の手順を実行します。
プログラムをビルドします。
cd src/
make
プログラムを実行する
./test-amxtile
プログラムをクリーンアップする
make clean