reweight gpt
1.0.0
Uma alternativa ao mecanismo de autoatenção na arquitetura Tranformer. Ele usa conexões laterais que podem ser aprendidas para reponderar as entradas diretamente, em vez do mecanismo de autoatenção (conforme ilustrado abaixo). Para saber mais sobre o método, assista a este vídeo (a partir de 41:26): https://youtu.be/l-CjXFmcVzY