이 프로젝트는 더 이상 인텔에서 유지 관리하지 않습니다.
인텔은 이 프로젝트에 대한 유지 관리, 버그 수정, 새 릴리스 또는 업데이트를 포함하되 이에 국한되지 않는 개발 및 기여를 중단했습니다.
인텔은 더 이상 이 프로젝트에 대한 패치를 받아들이지 않습니다.
이 프로젝트를 지속적으로 사용해야 하거나 독립적으로 개발하는 데 관심이 있거나 오픈 소스 소프트웨어 커뮤니티에 대한 패치를 유지하려는 경우 이 프로젝트의 자체 포크를 만드십시오.
인텔® 제온® 스케일러블 프로세서 Max 시리즈 및 4세대 인텔® 제온® 스케일러블 프로세서의 인텔® 고급 매트릭스 확장(인텔® AMX) 기능을 보여주는 코드 샘플.
Intel® AMX는 이제 x86 ISA(명령 집합 아키텍처)에 대한 새로운 확장 기능을 도입하여 행렬 작업을 수행하고 AI 워크로드에서 행렬 곱셈을 가속화할 수 있습니다. 이는 두 가지 구성 요소로 구성됩니다.
이 코드 샘플은 내장 함수를 사용하여 새 명령어를 테스트하는 방법을 보여줍니다.
이 샘플에 대한 코드 연습은 https://www.intel.com/content/www/us/en/developer/articles/code-sample/advanced-matrix-extensions-intrinsics-functions.html에서 확인할 수 있습니다.
코드 샘플은 INT8 값을 포함하는 16 x 64 크기의 행렬 A와 B를 곱하고 그 결과를 INT32 값을 포함하는 16 x 16 행렬 C에 누적합니다.
이 코드 샘플은 새로운 Intel(R) AMX 명령어의 사용을 강조하기 위해 단순화되었습니다. 타일을 구성하고, 메모리에서 타일로 데이터를 로드하고, 타일 데이터에 대해 하나의 행렬 곱셈을 수행하고, 결과를 타일에서 메모리로 복사하는 명령의 사용을 보여줍니다. 프로덕션 코드의 기초로 사용해서는 안 됩니다. 데모 목적으로만 사용됩니다.
이 코드 샘플은 MIT 라이센스에 따라 라이센스가 부여됩니다.
test-amxtile
실행 파일 빌드다음 단계를 수행하십시오.
프로그램을 빌드합니다.
cd src/
make
프로그램 실행
./test-amxtile
프로그램을 청소하세요
make clean