commented transformers
1.0.0
처음부터 변환기를 생성하기 위한 PyTorch의 변환기 구현에 대해 높은 평가를 받은 시리즈:
레이어 폴더에는 Bidirection Attention, Causal Attention 및 CausalCrossAttention에 대한 구현이 포함되어 있습니다.
models 폴더에는 GPT-2 및 BERT에 대한 단일 파일 구현이 포함되어 있습니다. 두 모델 모두 torch.compile(..., fullgraph=True)
와 호환됩니다.