Transformer Architectures From Scratch
1.0.0
基於自註意力的編碼器-解碼器架構。它主要用於
論文 - https://arxiv.org/abs/1706.03762
基於自註意力的編碼器架構。它主要用於
論文 - https://arxiv.org/abs/1810.04805
基於自註意力的解碼器的自回歸模型。它主要用於
論文 - https://paperswithcode.com/method/gpt
基於自註意力解碼器的自回歸模型,在架構上略有變化,並在比 GPT-1 更大的文字語料庫上進行訓練。它主要用於
論文 - https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf
用於電腦視覺應用的最先進的基於自註意力的編碼器架構。它主要用於
論文 - https://arxiv.org/abs/2006.03677
一種基於自註意力的編碼器-解碼器架構,具有線性時間複雜度,而不是具有二次時間複雜度的變壓器。大部分都是用它
論文 - https://arxiv.org/abs/2009.14794