英特尔将不再维护该项目。
英特尔已停止对此项目的开发和贡献,包括但不限于维护、错误修复、新版本或更新。
英特尔不再接受该项目的补丁。
如果您持续需要使用该项目,有兴趣独立开发它,或者想为开源软件社区维护补丁,请创建您自己的该项目的分支。
显示英特尔® 至强® 可扩展处理器 Max 系列和第四代英特尔® 至强® 可扩展处理器上的英特尔® 高级矩阵扩展(英特尔® AMX)功能的代码示例。
英特尔® AMX 现在引入了 x86 指令集架构 (ISA) 的新扩展来处理矩阵,这可能会加速人工智能工作负载中的矩阵乘法。它由两个部分组成:
此代码示例演示了使用内部函数测试新指令。
此示例的代码演练可在以下位置找到:https://www.intel.com/content/www/us/en/developer/articles/code-sample/advanced-matrix-extensions-intrinsics-functions.html
该代码示例将包含 INT8 值的大小为 16 x 64 的矩阵 A 和 B 相乘,并将结果累加到包含 INT32 值的 16 x 16 矩阵 C。
此代码示例经过简化,以突出显示新 Intel(R) AMX 指令的使用。它展示了如何使用指令来配置图块、将数据从内存加载到图块中、对图块数据执行一个矩阵乘法并将结果从图块复制到内存。它不应该用作生产代码的基础。仅用于演示目的。
此代码示例已根据 MIT 许可证获得许可。
test-amxtile
可执行文件执行以下步骤:
构建程序。
cd src/
make
运行程序
./test-amxtile
清理程序
make clean