few shot lm Télécharger - few shot lm Téléchargement du code source

few shot lm

Autre code source

1.0.0

Télécharger

Les modèles linguistiques sont des apprenants multilingues peu nombreux

Papier

Voici le code source de l'article [Arxiv] [ACL Anthology] :

Ce code a été écrit en utilisant PyTorch. Si vous utilisez des codes sources ou des ensembles de données inclus dans cette boîte à outils dans votre travail, veuillez citer l'article suivant :

 @inproceedings{winata-etal-2021-langue,
    title = "Les modèles linguistiques sont des apprenants multilingues peu nombreux",
    auteur = "Winata, Genta Indra et
      Madotto, Andrea et
      Lin, Zhaojiang et
      Liu, Rosanne et
      Yosinski, Jason et
      Fung, Pascale",
    booktitle = "Actes du 1er atelier sur l'apprentissage des représentations multilingues",
    mois = novembre,
    année = "2021",
    adresse = "Punta Cana, République Dominicaine",
    éditeur = "Association pour la linguistique computationnelle",
    url = "https://aclanthology.org/2021.mrl-1.1",
    pages = "1--15",
}

Environnement de configuration

Machine GPU

pip install -r requirements.txt

Machine GPU pour exécuter le modèle GPT-J 6B

apt install zstd

# the "slim" version contain only bf16 weights and no optimizer parameters, which minimizes bandwidth and memory
wget -c https://the-eye.eu/public/AI/GPT-J-6B/step_383500_slim.tar.zstd

tar -I zstd -xf step_383500_slim.tar.zstd

pip install -r mesh_transformer_jax/requirements.txt

# jax 0.2.12 is required due to a regression with xmap in 0.2.13
pip install mesh-transformer-jax/ jax==0.2.12

# cuda[your_cuda_version]
pip install jaxlib==0.1.67+cuda101 -f https://storage.googleapis.com/jax-releases/jax_releases.html

Comment courir

Tâche croisée sans tir

❱❱❱ CUDA_VISIBLE_DEVICES=0 python evaluate.py  --dataset snips --model_checkpoint facebook/bart-large-mnli --cuda --length 5 --label_type value --src_lang en --tgt_lang en --seed 42 --use_log_prob --use_confidence --is_cross_task

Affiner

❱❱❱ CUDA_VISIBLE_DEVICES=0 python finetune.py  --dataset snips --model_checkpoint bert-base-multilingual-uncased --cuda --label_type value --src_lang en --tgt_lang en --seed 42

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2024-12-14
taille 3GB
Provenant de Github

Applications connexes

shot_matcher

2024-11-11
Jeu Tir de zone morte

2024-02-07
Nous sommes quelques heureux

2022-09-05
Héros abattus

2022-08-31
Brûlure à chaud

2022-08-18
Tourné dans le noir

2022-08-08

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
SmartTube

Autre code source

24.71 Stable
Sunamu

Autre code source

Release 2.2.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout