reweight gpt
1.0.0
Eine Alternative zum Selbstaufmerksamkeitsmechanismus in der Transformer-Architektur. Es verwendet lernbare seitliche Verbindungen, um die Eingaben direkt neu zu gewichten, anstelle des Selbstaufmerksamkeitsmechanismus (wie unten dargestellt). Um mehr über die Methode zu erfahren, schauen Sie sich dieses Video an (ab 41:26): https://youtu.be/l-CjXFmcVzY