reweight gpt
1.0.0
Transformer アーキテクチャの自己攻撃メカニズムの代替手段。これは、学習可能な横方向の接続を使用して、自己注意メカニズムの代わりに入力を直接再重み付けします (下図を参照)。この方法の詳細については、このビデオ (41:26 から) をご覧ください: https://youtu.be/l-CjXFmcVzY