Transformer Architectures From Scratch
1.0.0
セルフ アテンション ベースのエンコーダ デコーダ アーキテクチャ。主に次の用途に使用されます
論文 - https://arxiv.org/abs/1706.03762
セルフアテンションベースのエンコーダアーキテクチャ。主に次の用途に使用されます
論文 - https://arxiv.org/abs/1810.04805
Self-attention ベースの Decoder ベースの自己回帰モデル。主に次の用途に使用されます
論文 - https://paperswithcode.com/method/gpt
Self-attention ベースの Decoder ベースの自己回帰モデル。アーキテクチャがわずかに変更され、GPT-1 よりも大きなテキスト コーパスでトレーニングされています。主に次の用途に使用されます
論文 - https://d4mucfpksywv.cloudfront.net/better- language-models/ language-models.pdf
コンピューター ビジョン アプリケーション向けの最先端のセルフアテンション ベースのエンコーダー アーキテクチャ。主に次の用途に使用されます
論文 - https://arxiv.org/abs/2006.03677
二次時間計算量を持つトランスフォーマーとは別の、線形時間計算量を持つセルフアテンション ベースのエンコーダー/デコーダー アーキテクチャ。主に使われているのは
論文 - https://arxiv.org/abs/2009.14794