Unduh l2p - Unduh Kode Sumber l2p

l2p

Kode sumber lainnya

1.0.0

Unduh

Implementasi JAX Pembelajaran Berbasis Berbasis Prompt

Basis kode ini berisi implementasi dua metode pembelajaran berkelanjutan:

Belajar Minta untuk Pembelajaran berkelanjutan (L2P) (CVPR2022) [Google AI Blog]
DualPrompt: Complementary Foredming untuk pembelajaran berkelanjutan bebas latihan (ECCV2022)

Perkenalan

L2P adalah teknik pembelajaran berkelanjutan baru yang belajar secara dinamis mendorong model pra-terlatih untuk mempelajari tugas secara berurutan di bawah transisi tugas yang berbeda. Berbeda dari metode berbasis latihan utama atau berbasis arsitektur, L2P tidak memerlukan buffer latihan atau identitas tugas waktu tes. L2P dapat digeneralisasi ke berbagai pengaturan pembelajaran berkelanjutan termasuk pengaturan agnostik-agnostik yang paling menantang dan realistis. L2P secara konsisten mengungguli metode canggih sebelumnya. Anehnya, L2P mencapai hasil kompetitif terhadap metode berbasis latihan bahkan tanpa buffer latihan.

DualPrompt meningkatkan L2P dengan melampirkan permintaan komplementer ke tulang punggung yang sudah terlatih, dan kemudian merumuskan tujuan sebagai pembelajaran-invarian tugas dan “instruksi” yang spesifik tugas. Dengan validasi eksperimental yang luas, DualPrompt secara konsisten menetapkan kinerja canggih di bawah seni di bawah ini di bawah kinerja yang canggih di bawah ini di bawah ini di bawah kinerja yang canggih di bawah ini di bawah kinerja yang canggih di bawah ini di bawah ini di bawah kinerja canggih di bawah ini di bawah ini di bawah kinerja canggih di bawah ini di bawah kinerja canggih di bawah ini di bawah ini di bawah Performa Canggih di bawah Performa Canggih di bawah THE Pengaturan intremental kelas yang menantang.

Kode ditulis oleh Zifeng Wang. Pengakuan untuk https://github.com/google-research/nested-transformer.

Ini bukan produk Google yang didukung secara resmi.

Novel CL Benchmark: Split ImageNet-R

Benchmark Imagenet-R Split dibangun berdasarkan Imagenet-R dengan membagi 200 kelas menjadi 10 tugas dengan 20 kelas per tugas, lihat libml/input_pipeline.py untuk detailnya. Kami percaya Split Imagenet-R sangat penting bagi komunitas pembelajaran berkelanjutan, karena alasan berikut:

Split ImageNet-R berisi kelas dengan gaya yang berbeda, yang lebih dekat dengan masalah dunia nyata yang rumit.
Keragaman intra-kelas yang signifikan menimbulkan tantangan besar bagi metode berbasis latihan untuk bekerja secara efektif dengan ukuran buffer kecil, sehingga mendorong pengembangan metode yang lebih praktis dan bebas latihan.
Model visi pra-terlatih berguna dalam pembelajaran terus-menerus praktis. Namun, set pelatihan mereka biasanya mencakup Imagenet. Dengan demikian, Split Imagenet-R berfungsi sebagai tolok ukur yang relatif adil dan menantang, dan alternatif untuk tolok ukur berbasis Imagenet untuk pembelajaran berkelanjutan yang menggunakan model pra-terlatih.

Pytorch Reimplementation

Basis kode telah diimplementasikan kembali dalam Pytorch oleh Jaeho Lee di L2P-Pytorch dan DualPromppt-Pytorch.

Pengaturan Enviroment

 pip install -r requirements.txt

Setelah ini, Anda mungkin perlu menyesuaikan versi JAX Anda sesuai dengan versi driver CUDA Anda sehingga Jax mengidentifikasi GPU Anda dengan benar (lihat masalah ini untuk lebih jelasnya).

CATATAN: Basis kode telah diuji secara tidak diuji di bawah lingkungan TPU menggunakan versi Jax terbaru. Kami saat ini sedang berupaya memverifikasi lebih lanjut lingkungan GPU.

Persiapan dataset

Sebelum menjalankan percobaan untuk 5-data dan Core50, langkah persiapan dataset tambahan harus dilakukan sebagai berikut:

Unduh Benchmark Klasifikasi Core50 Di Sini: https://vlomonaco.github.io/core50/ dan unduh not-mnist di sini: http://yaroslavvb.com/upload/notmnist/
Ubah mereka menjadi bentuk kompatibel TFD setelah tutorial di https://www.tensorflow.org/datasets/add_dataset
Ganti jalur dataset yang sesuai "PATH_TO_CORE50" dan "PATH_TO_NOT_MNIST" di libml/input_pipeline.py dengan jalur tujuan pada langkah 2

Mendapatkan model vit pretrained

Model Vit-B/16 yang digunakan dalam makalah ini dapat diunduh di sini. Catatan: Basis kode kami sebenarnya mendukung berbagai ukuran VIT. Jika Anda ingin mencoba variasi VIT, jangan ragu untuk mengubah config.model_name dalam file konfigurasi, mengikuti opsi yang valid yang ditentukan dalam model/vit.py.

Instruksi menjalankan L2P dan DualPrompt

Kami menyediakan file konfigurasi untuk melatih dan mengevaluasi L2P dan DualPromppt pada beberapa tolok ukur di konfigurasi.

Untuk menjalankan L2P pada dataset benchmark:

 python main.py --my_config configs/$L2P_CONFIG --workdir=./l2p --my_config.init_checkpoint=<ViT-saved-path/ViT-B_16.npz>

di mana $L2P_CONFIG dapat menjadi salah satu berikut: [cifar100_l2p.py, five_datasets_l2p.py, core50_l2p.py, cifar100_gaussian_l2p.py] .

Catatan: Kami menjalankan percobaan kami menggunakan 8 V100 GPU atau 4 TPU, dan kami menentukan ukuran batch per perangkat 16 dalam file konfigurasi. Ini menunjukkan bahwa kami menggunakan ukuran batch total 128.

Untuk menjalankan DualPromppt pada dataset Benchmark:

 python main.py --my_config configs/$DUALPROMPT_CONFIG --workdir=./dualprompt --my_config.init_checkpoint=<ViT-saved-path/ViT-B_16.npz>

di mana $DUALPROMPT_CONFIG dapat menjadi salah satu berikut: [imr_dualprompt.py, cifar100_dualprompt.py] .

Visualisasikan hasil

Kami menggunakan Tensorboard untuk memvisualisasikan hasilnya. Misalnya, jika direktori kerja yang ditentukan untuk menjalankan l2p adalah workdir=./cifar100_l2p , perintah untuk memeriksa hasil adalah sebagai berikut:

 tensorboard --logdir ./cifar100_l2p

Berikut adalah metrik penting untuk dilacak, dan makna yang sesuai:

Metrik	Keterangan
Accuracy_n	Keakuratan tugas ke-n
lupa	Rata -rata melupakan sampai tugas saat ini
avg_acc	Akurasi evaluasi rata -rata hingga tugas saat ini

Mengutip

 @inproceedings{wang2022learning,
  title={Learning to prompt for continual learning},
  author={Wang, Zifeng and Zhang, Zizhao and Lee, Chen-Yu and Zhang, Han and Sun, Ruoxi and Ren, Xiaoqi and Su, Guolong and Perot, Vincent and Dy, Jennifer and Pfister, Tomas},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  pages={139--149},
  year={2022}
}

 @article{wang2022dualprompt,
  title={DualPrompt: Complementary Prompting for Rehearsal-free Continual Learning},
  author={Wang, Zifeng and Zhang, Zizhao and Ebrahimi, Sayna and Sun, Ruoxi and Zhang, Han and Lee, Chen-Yu and Ren, Xiaoqi and Su, Guolong and Perot, Vincent and Dy, Jennifer and others},
  journal={European Conference on Computer Vision},
  year={2022}
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-02-17
ukuran 291.14KB
Berasal dari Github

Aplikasi Terkait

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
chat.petals.dev

2024-11-30
viptools for eslam

2024-12-15

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
SmartTube

Kode sumber lainnya

24.71 Stable
Sunamu

Kode sumber lainnya

Release 2.2.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
wp functions

Kategori lainnya

1.0.0
termwind

Kategori lainnya

v2.3.0

Informasi Terkait Semua