lambda networks
0.4.0
Implementierung von λ Networks, einem neuen Ansatz zur Bilderkennung, der SOTA auf ImageNet erreicht. Die neue Methode nutzt die λ-Schicht, die Interaktionen erfasst, indem sie Kontexte in lineare Funktionen, sogenannte Lambdas, umwandelt und diese linearen Funktionen separat auf jede Eingabe anwendet.
Rezension von Yannic Kilcher
$ pip install lambda-networks
Globaler Kontext
import torch
from lambda_networks import LambdaLayer
layer = LambdaLayer (
dim = 32 , # channels going in
dim_out = 32 , # channels out
n = 64 , # size of the receptive window - max(height, width)
dim_k = 16 , # key dimension
heads = 4 , # number of heads, for multi-query
dim_u = 1 # 'intra-depth' dimension
)
x = torch . randn ( 1 , 32 , 64 , 64 )
layer ( x ) # (1, 32, 64, 64)
Lokalisierter Kontext
import torch
from lambda_networks import LambdaLayer
layer = LambdaLayer (
dim = 32 ,
dim_out = 32 ,
r = 23 , # the receptive field for relative positional encoding (23 x 23)
dim_k = 16 ,
heads = 4 ,
dim_u = 4
)
x = torch . randn ( 1 , 32 , 64 , 64 )
layer ( x ) # (1, 32, 64, 64)
Zum Spaß können Sie dies auch wie folgt importieren
from lambda_networks import λLayer
Shinel94 hat eine Keras-Implementierung hinzugefügt! Es wird in diesem Repository nicht offiziell unterstützt. Kopieren Sie daher entweder den Code unter ./lambda_networks/tfkeras.py
oder fügen Sie ihn ein oder stellen Sie sicher, dass Sie tensorflow
und keras
installieren, bevor Sie Folgendes ausführen.
import tensorflow as tf
from lambda_networks . tfkeras import LambdaLayer
layer = LambdaLayer (
dim_out = 32 ,
r = 23 ,
dim_k = 16 ,
heads = 4 ,
dim_u = 1
)
x = tf . random . normal (( 1 , 64 , 64 , 16 )) # channel last format
layer ( x ) # (1, 64, 64, 32)
@inproceedings {
anonymous2021lambdanetworks,
title = { LambdaNetworks: Modeling long-range Interactions without Attention } ,
author = { Anonymous } ,
booktitle = { Submitted to International Conference on Learning Representations } ,
year = { 2021 } ,
url = { https://openreview.net/forum?id=xTJEN-ggl1b } ,
note = { under review }
}