Download transformers data augmentation - download de código fonte transformers data augmentation

transformers data augmentation

Outro código-fonte

1.0.0

Baixar

Aumento de dados usando modelos de transformadores pré-treinados

Código associado ao aumento de dados usando papel de modelos de transformadores pré-treinados

O código contém a implementação dos seguintes métodos de aumento de dados

EDA (linha de base)
Retrotradução (linha de base)
CBERT (linha de base)
BERT Prepend (Nosso artigo)
Prepend GPT-2 (Nosso artigo)
Prepend BART (Nosso artigo)

Conjuntos de dados

No papel, usamos três conjuntos de dados dos seguintes recursos

STSA-2: https://github.com/1024er/cbert_aug/tree/crayon/datasets/stsa.binary
TREC: https://github.com/1024er/cbert_aug/tree/crayon/datasets/TREC
SNIPS: https://github.com/MiuLab/SlotGated-SLU/tree/master/data/snips

Configuração do experimento em regime de poucos dados

Execute o arquivo src/utils/download_and_prepare_datasets.sh para preparar todos os conjuntos de dados.
download_and_prepare_datasets.sh executa as seguintes etapas

Baixe dados do github
Substitua rótulos numéricos por texto para conjunto de dados STSA-2 e TREC
Para um determinado conjunto de dados, cria 15 divisões aleatórias de dados de treinamento e desenvolvimento.

Dependências

Para executar este código, você precisa das seguintes dependências

Pytorch 1.5
fairseq 0,9
transformadores 2.9

Como correr

Para executar um experimento de aumento de dados para um determinado conjunto de dados, execute o script bash na pasta de scripts . Por exemplo, para executar o aumento de dados no conjunto de dados snips ,

execute scripts/bart_snips_lower.sh para experimento BART
execute scripts/bert_snips_lower.sh para o restante dos métodos de aumento de dados

Como citar

 @inproceedings{kumar-etal-2020-data,
    title = "Data Augmentation using Pre-trained Transformer Models",
    author = "Kumar, Varun  and
      Choudhary, Ashutosh  and
      Cho, Eunah",
    booktitle = "Proceedings of the 2nd Workshop on Life-long Learning for Spoken Language Systems",
    month = dec,
    year = "2020",
    address = "Suzhou, China",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.lifelongnlp-1.3",
    pages = "18--26",
}