Téléchargement PuMer - Téléchargement du code source PuMer

PuMer

Autre code source

1.0.0

Télécharger

PuMer (ACL 2023)

Ce dépôt est l'implémentation officielle de l'article "PuMer: Pruning and Merging Tokens for Efficient Vision Language Models", article

Usage

Installer

installez miniforge (identique à conda, plus portable) créez un environnement python : conda env create -f env.yaml , activez-le : conda activate pumer clonez ce dépôt : [email protected]:csarron/pumer.git

tester cuda : python -c "import torch;print(torch.cuda.is_available())"

obtenir l'environnement de torche : python -m torch.utils.collect_env

installer : pip install -e .

à des fins de développement local : pip install -e ".[dev]"

Le env-frozen.yaml est généré via conda env export | grep -v "^prefix: | pumer==" > env-frozen.yaml

Préparer les données et les modèles pré-entraînés

voir notes/data.md pour le prétraitement des données

voir cli/prep/convert_ckpt.py pour convertir les points de contrôle METER et ViLT pré-entraînés d'origine

ci-dessous la présentation du fichier après préparation :

# tree -h data
├── [4.0K]  ckpt
│   └── [4.0K]  converted
│       ├── [4.0K]  meter_pretrain_384
│       │   ├── [ 674]  config.json
│       │   └── [1.3G]  pytorch_model.bin
│       ├── [4.0K]  meter_pretrain_irtr_384
│       │   ├── [ 729]  config.json
│       │   └── [1.2G]  pytorch_model.bin
│       ├── [4.0K]  meter_pretrain_nlvr2_288
│       │   ├── [ 674]  config.json
│       │   └── [1.3G]  pytorch_model.bin
│       ├── [4.0K]  vilt_pretrain
│       │   ├── [ 619]  config.json
│       │   └── [518M]  pytorch_model.bin
│       ├── [4.0K]  vilt_pretrain_irtr
│       │   ├── [ 718]  config.json
│       │   └── [426M]  pytorch_model.bin
│       └── [4.0K]  vilt_pretrain_nlvr2
│           ├── [ 619]  config.json
│           └── [518M]  pytorch_model.bin
├── [4.0K]  datasets
│   ├── [4.0K]  irtr
│   │   ├── [390K]  flickr30k-test.jsonl
│   │   ├── [ 11M]  flickr30k-train.jsonl
│   │   ├── [397K]  flickr30k-val.jsonl
│   │   ├── [ 10M]  mscoco-restval.jsonl
│   │   ├── [1.7M]  mscoco-test.jsonl
│   │   ├── [ 28M]  mscoco-train.jsonl
│   │   └── [1.7M]  mscoco-val.jsonl
│   ├── [4.0K]  nlvr2
│   │   ├── [3.6M]  dev.json
│   │   ├── [3.6M]  test1.json
│   │   └── [ 39M]  train.json
│   ├── [4.0K]  snli-ve
│   │   ├── [ 16M]  snli_ve_dev.jsonl
│   │   ├── [ 16M]  snli_ve_test.jsonl
│   │   └── [464M]  snli_ve_train.jsonl
│   └── [4.0K]  vqa2
│       ├── [ 57K]  vqa2_ans2label.json
│       ├── [ 39K]  vqa2_label2ans.json
│       ├── [161K]  vqa2-small.jsonl
│       ├── [ 45M]  vqa2-test2015.jsonl
│       ├── [ 71M]  vqa2-train2014.jsonl
│       └── [ 34M]  vqa2-val2014.jsonl
└── [4.0K]  lmdb
    ├── [ 13G]  coco-test2015.lmdb
    ├── [ 19G]  coco-trainval2014.lmdb
    ├── [4.2G]  flickr30k_images.lmdb
    ├── [837M]  nlvr2-dev.lmdb
    ├── [837M]  nlvr2-test1.lmdb
    └── [ 11G]  nlvr2-train.lmdb

Formation et évaluation

voir notes/cmd.md pour un exemple d'utilisation ;

consultez https://huggingface.co/csarron pour les points de contrôle fins : ( -ft est le modèle original affiné, p0.x-r0.x-t0.x-xxx est notre modèle PuMer)

vilt-vqa2-ft
vilt-vqa2-p0.1-r0.3-t0.2-258
vilt-ve-ft 
vilt-ve-p0.1r0.3t0.2-2468 
vilt-nlvr2-ft 
vilt-nlvr2-p0.1r0.3t0.2-258
meter-vqa2-ft
meter-vqa2-p0.2r0.2t0.2-0246
meter-ve-ft 
meter-ve-p0.3r0.5t0.2-0246 
meter-nlvr2-ft 
meter-nlvr2-p0.3r0.5t0.2-246

Profilage des FLOP

voir notes/profile.md

FAQ

définissez TRANSFORMERS_OFFLINE=1 après la première utilisation, sinon il signalera parfois une erreur 504 en raison d'une recherche toujours en ligne.

Divers

ignorer le code dans src/pumer/model/pruner.py (obsolète et inutilisé), doit être nettoyé
la base de code actuelle contient de nombreux fouillis et du code expérimental qui n'est pas lié à l'implémentation de PuMer, veuillez l'ignorer.

Citation

 @inproceedings{cao-etal-2023-pumer, title = "{P}u{M}er : élagage et fusion de jetons pour des modèles de langage de vision efficaces", author = "Cao, Qingqing et Paranjape, Bhargavi et Hajishirzi, Hannaneh", booktitle = "Actes de la 61e réunion annuelle de l'Association for Computational Linguistics (Volume 1 : Long Articles)", mois = juillet, année = "2023", adresse = "Toronto, Canada", éditeur = "Association for Computational Linguistics", url = "https://aclanthology.org/2023.acl-long.721" , pages = "12890--12903",
}

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2024-12-21
taille 89.9KB
Provenant de Github

Applications connexes

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
chat.petals.dev

2024-11-30

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
SmartTube

Autre code source

24.71 Stable
Sunamu

Autre code source

Release 2.2.0
waymo open dataset

Autre code source

December 2023 Update
wp functions

Autres catégories

1.0.0
termwind

Autres catégories

v2.3.0

Actualités connexes Tout