Архитектура кодировщика-декодера, основанная на самообслуживании. В основном он используется для
Бумага - https://arxiv.org/abs/1706.03762
Архитектура кодировщика, основанная на самообслуживании. В основном он используется для
Бумага - https://arxiv.org/abs/1810.04805
Модель авторегрессии на основе декодера, основанная на самообслуживании. В основном он используется для
Бумага - https://paperswithcode.com/method/gpt
Модель авторегрессии на основе декодера, основанная на самообслуживании, с небольшими изменениями в архитектуре и обученная на более крупном корпусе текста, чем GPT-1. В основном он используется для
Бумага - https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf
Современная архитектура кодировщика на основе самообслуживания для приложения компьютерного зрения. В основном он используется для
Бумага - https://arxiv.org/abs/2006.03677
Архитектура кодировщика-декодера, основанная на самообслуживании, с линейной временной сложностью, отличной от трансформатора, который имеет квадратичную временную сложность. В основном он используется
Бумага - https://arxiv.org/abs/2009.14794