Descargar Mega pytorch - Descarga del código fuente Mega pytorch

Mega pytorch

Código Fuente de IA

0.1.0

Descargar

Mega - Atención privada equipada con media móvil - Pytorch

Implementación de la capa Mega, la capa de Atención de un solo cabezal con EMA de múltiples cabezales que existe en la arquitectura que actualmente tiene SOTA en Long Range Arena, superando a S4 en Pathfinder-X y todas las demás tareas excepto el audio.

Instalar

$ pip install mega-pytorch

Uso

La Mega Capa con combinación de atención y EMA aprendida

 import torch
from mega_pytorch import MegaLayer

layer = MegaLayer (
    dim = 128 ,                   # model dimensions
    ema_heads = 16 ,              # number of EMA heads
    attn_dim_qk = 64 ,            # dimension of queries / keys in attention
    attn_dim_value = 256 ,        # dimension of values in attention
    laplacian_attn_fn = False ,   # whether to use softmax (false) or laplacian attention activation fn (true)
)

x = torch . randn ( 1 , 1024 , 128 )     # (batch, seq, dim)

out = layer ( x ) # (1, 1024, 128)

Full Mega (con Layernorm por ahora)

 import torch
from mega_pytorch import Mega

mega = Mega (
    num_tokens = 256 ,            # number of tokens
    dim = 128 ,                   # model dimensions
    depth = 6 ,                   # depth
    ema_heads = 16 ,              # number of EMA heads
    attn_dim_qk = 64 ,            # dimension of queries / keys in attention
    attn_dim_value = 256 ,        # dimensino of values in attention
    laplacian_attn_fn = True ,    # whether to use softmax (false) or laplacian attention activation fn (true)
)

x = torch . randint ( 0 , 256 , ( 1 , 1024 ))

logits = mega ( x ) # (1, 1024, 256)

Hacer

agregue un sesgo posicional dinámico para obtener el mejor arco de extrapolación de longitud

Citas

 @inproceedings { Ma2022MegaMA ,
    title   = { Mega: Moving Average Equipped Gated Attention } ,
    author  = { Xuezhe Ma and Chunting Zhou and Xiang Kong and Junxian He and Liangke Gui and Graham Neubig and Jonathan May and Luke Zettlemoyer } ,
    year    = { 2022 }
}

Expandir

Información adicional

Versión 0.1.0
Tipo Código Fuente de IA
Fecha de actualización 2025-01-27
tamaño 34.92MB
Proviene de Github

Aplicaciones relacionadas

pytorch image models

2024-11-03
mega fútbol

2024-06-24
Juego Mega Zombie M

2024-02-21
Juego Megabicicleta

2023-05-09
SEGA MegaDrive

2022-08-10
Script de alojamiento de mega archivos

2009-04-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
node telegram bot api

Código Fuente de IA

v0.50.0
typebot.io

Código Fuente de IA

v3.1.2
python wechaty getting started

Código Fuente de IA

1.0.0
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo