Este projeto não será mais mantido pela Intel.
A Intel cessou o desenvolvimento e as contribuições, incluindo, mas não se limitando a, manutenção, correções de bugs, novos lançamentos ou atualizações para este projeto.
A Intel não aceita mais patches para este projeto.
Se você tem uma necessidade contínua de usar este projeto, está interessado em desenvolvê-lo de forma independente ou gostaria de manter patches para a comunidade de software de código aberto, crie seu próprio fork deste projeto.
Amostra de código mostrando a funcionalidade Intel® Advanced Matrix Extensions (Intel® AMX) no processador escalável Intel® Xeon® série Max e nos processadores escaláveis Intel® Xeon® de 4ª geração.
O Intel® AMX agora apresenta novas extensões para a arquitetura de conjunto de instruções (ISA) x86 para trabalhar em matrizes e que pode acelerar a multiplicação de matrizes em cargas de trabalho de IA. Consiste em dois componentes:
Este exemplo de código demonstra o teste das novas instruções usando funções intrínsecas.
Um passo a passo do código para este exemplo pode ser encontrado em: https://www.intel.com/content/www/us/en/developer/articles/code-sample/advanced-matrix-extensions-intrinsics-functions.html
O exemplo de código multiplicará as matrizes A e B de tamanho 16 x 64 contendo valores INT8 e acumulará o resultado em uma matriz C 16 x 16 contendo valores INT32.
Este exemplo de código é simplificado para destacar o uso das novas instruções Intel(R) AMX. Ele mostra o uso de instruções para configurar os blocos, carregar dados da memória em blocos, realizar uma multiplicação de matriz nos dados dos blocos e copiar o resultado dos blocos para a memória. Não deve ser usado como base para código de produção. Somente para fins de demonstração.
Este exemplo de código está licenciado sob licença do MIT.
test-amxtile
Execute as seguintes etapas:
Construa o programa.
cd src/
make
Execute o programa
./test-amxtile
Limpe o programa
make clean