Unduhan UniIR - Unduhan kode Sumber UniIR

UniIR

Kode Sumber AI

1.0.0

Unduh

UniIR

Beranda | ? Kumpulan Data (Tolok Ukur M-BEIR) | ? Pos pemeriksaan (model UniIR ) | arXiv | GitHub

Repo ini berisi basis kode untuk makalah ECCV-2024 " UniIR : Pelatihan dan Pembandingan Pengambil Informasi Multimodal Universal"

?Berita

[13-04-2024] : Kami menyoroti penelitian berharga dan bersamaan lainnya tentang pelatihan pengambil multi-modal yang mengikuti instruksi dan multi-tugas dengan Interaksi Terlambat: PreFLMR: Meningkatkan Pengambil Multi-modal Interaksi Akhir yang Berbutir Halus , yaitu dilakukan oleh para peneliti dari Universitas Cambridge. Mereka juga memperkenalkan tolok ukur M2KR yang dapat digunakan untuk melatih dan mengevaluasi pengambil informasi universal multi-modal. Kami dapat menggabungkan tolok ukur M2KR dan M-BEIR untuk memfasilitasi kemajuan bidang ini.
[18-03-2024]: Melepaskan pos pemeriksaan besar UniIR (CLIP_SF) dan UniIR (BLIP_FF) ? Pos pemeriksaan
[21-12-2023]: Kami? Tolok Ukur M-BEIR sekarang tersedia untuk digunakan.

Perkenalan

Kami mengusulkan kerangka kerja UniIR (Universal multimodal Information Retrieval) untuk mempelajari satu retriever guna menyelesaikan (mungkin) tugas pengambilan apa pun. Tidak seperti sistem IR tradisional, UniIR perlu mengikuti instruksi untuk mengambil kueri heterogen guna mengambil dari kumpulan kandidat heterogen dengan jutaan kandidat dalam modalitas yang beragam.

Isi

M-BEIR
Pelatihan
Evaluasi
Kebun Binatang Model
Kutipan dan Kontak

M-BEIR

Untuk melatih dan mengevaluasi model pengambilan multimodal universal, kami membangun tolok ukur pengambilan skala besar yang diberi nama M-BEIR (Multimodal BEnchmark for Instructed Retrieval).

Pengunduhan M-BEIR

Kami menyediakan dataset M-BEIR di ? Kumpulan data . Silakan ikuti instruksi yang diberikan di halaman HF untuk mengunduh kumpulan data dan menyiapkan data untuk pelatihan dan evaluasi. Anda perlu menyiapkan GiT LFS dan langsung mengkloning repo:

 git clone https://huggingface.co/datasets/TIGER-Lab/M-BEIR

Model UniIR

Kami menyediakan basis kode untuk melatih dan mengevaluasi model UniIR CLIP-ScoreFusion, CLIP-FeatureFusion, BLIP-ScoreFusion, dan BLIP-FeatureFusion.

Lingkungan

Siapkan basis kode proyek UniIR dan lingkungan Conda menggunakan perintah berikut:

UniIR cd src/models/ conda env create -f UniIR _env.yml">

git clone https://github.com/TIGER-AI-Lab/UniIR
cd UniIR

cd src/models/
conda env create -f UniIR _env.yml

Pelatihan

Untuk melatih model UniIR dari pos pemeriksaan CLIP dan BLIP yang telah dilatih sebelumnya, ikuti petunjuk di bawah. Skrip akan secara otomatis mengunduh pos pemeriksaan CLIP dan BLIP yang telah dilatih sebelumnya.

1. Unduh Tolok Ukur M-BEIR

Silakan unduh benchmark M-BEIR dengan mengikuti petunjuk di bagian M-BEIR .

2. Naskah

Untuk melatih UniIR CLIP_SF Large dengan konfigurasi default:

 cd src/models/ UniIR _clip/clip_scorefusion/configs_scripts/large/train/inbatch/

Ubah inbatch.yaml untuk penyetelan hyperparameter dan run_inbatch.sh untuk lingkungan dan jalur Anda sendiri.

Catatan:

Ubah UniIR _DIR di run_inbatch.sh ke direktori tempat Anda ingin menyimpan pos pemeriksaan.
Ubah MBEIR_DATA_DIR di run_inbatch.sh ke direktori tempat Anda menyimpan benchmark M-BEIR.
Ubah SRC_DIR di run_inbatch.sh ke direktori tempat Anda menyimpan basis kode proyek UniIR (Repo ini).
Secara default, model UniIR dilatih pada M-BEIR dengan negatif dalam batch, dan negatif keras yang disediakan oleh kumpulan data asli tidak digunakan.
Kami menggunakan Wandb untuk mencatat proses pelatihan. Harap pastikan lingkungan .env dengan WANDB_API_KEY , WANDB_PROJECT , dan WANDB_ENTITY telah disetel.

Kemudian Anda dapat menjalankan perintah berikut untuk melatih model Besar UniIR CLIP_SF.

bash run_inbatch.sh

Untuk melatih UniIR BLIP_FF Besar dengan konfigurasi default:

 cd src/models/ UniIR _blip/blip_featurefusion/configs_scripts/large/train/inbatch/

Ubah inbatch.yaml untuk penyetelan hyperparameter dan run_inbatch.sh untuk lingkungan dan jalur Anda sendiri.

bash run_inbatch.sh

Demikian pula, Anda dapat melatih model UniIR CLIP_FF dan BLIP_SF dengan memodifikasi skrip yang sesuai.

Evaluasi

Kami menyediakan jalur evaluasi untuk model UniIR pada benchmark M-BEIR.

1. Lingkungan

Silakan buat lingkungan untuk perpustakaan FAISS:

 # From the root directory of the project
cd src/common/
conda env create -f faiss_env.yml

2. Download Tolok Ukur M-BEIR

Silakan unduh benchmark M-BEIR dengan mengikuti petunjuk di bagian M-BEIR .

3. Unduh Pos Pemeriksaan UniIR

Anda dapat melatih model UniIR dari awal atau mengunduh pos pemeriksaan UniIR yang telah dilatih sebelumnya dengan mengikuti petunjuk di bagian Model Zoo .

4. Naskah

Untuk mengevaluasi UniIR CLIP_SF Large dengan konfigurasi default:

 cd src/models/ UniIR _clip/clip_scorefusion/configs_scripts/large/eval/inbatch/

Ubah embed.yaml , index.yaml , retrieval.yaml dan run_eval_pipeline_inbatch.sh untuk lingkungan, jalur, dan pengaturan evaluasi Anda sendiri.

Catatan:

Jika Anda mengunduh model UniIR kami yang telah dilatih sebelumnya, harap ubah UniIR _DIR di run_eval_pipeline_inbatch.sh ke direktori tempat Anda ingin menyimpan file besar termasuk pos pemeriksaan, penyematan, indeks, dan hasil pengambilan. Kemudian Anda dapat menempatkan file clip_sf_large.pth di jalur berikut:
```
 $ UniIR _DIR /checkpoint/CLIP_SF/Large/Instruct/InBatch/clip_sf_large.pth
```
Ini jalur default yang ditentukan oleh model.ckpt_config di file embed.yaml .
Ubah MBEIR_DATA_DIR di run_eval_pipeline_inbatch.sh ke direktori tempat Anda menyimpan benchmark M-BEIR.
Ubah SRC_DIR di run_eval_pipeline_inbatch.sh ke direktori tempat Anda menyimpan basis kode proyek UniIR (repo ini).

Konfigurasi default akan mengevaluasi model Besar UniIR CLIP_SF pada tolok ukur M-BEIR (kumpulan kandidat heterogen 5,6 juta) dan M-BEIR_local (kumpulan kandidat homogen). UNION dalam file yaml mengacu pada M-BEIR (kumpulan kandidat heterogen 5,6 juta). Anda dapat mengikuti komentar di file yaml dan mengubah konfigurasi untuk mengevaluasi model pada benchmark M-BEIR_local saja.

bash run_eval_pipeline_inbatch.sh

embed , index , logger dan retrieval_results akan disimpan di direktori $ UniIR _DIR .

Untuk mengevaluasi UniIR BLIP_FF Besar dengan konfigurasi default:

 cd src/models/unii_blip/blip_featurefusion/configs_scripts/large/eval/inbatch/

Demikian pula, jika Anda mengunduh model UniIR kami yang telah dilatih sebelumnya, Anda dapat menempatkan file blip_ff_large.pth di jalur berikut:

 $ UniIR _DIR /checkpoint/BLIP_FF/Large/Instruct/InBatch/blip_ff_large.pth

Konfigurasi default akan mengevaluasi model Besar UniIR BLIP_FF pada benchmark M-BEIR dan M-BEIR_local.

bash run_eval_pipeline_inbatch.sh

Evaluasi UniRAG

Evaluasi UniRAG sangat mirip dengan evaluasi default dengan perbedaan sebagai berikut:

Ini menyimpan file jsonl yang berisi kueri dan kandidat yang diambil di bawah retrieval_results . Ini berguna ketika hasil yang diambil akan digunakan dalam aplikasi hilir seperti RAG.
Ketika retrieve_image_text_pairs di retrieval.yaml diatur ke True , kandidat pelengkap akan diambil untuk setiap kandidat dengan modalitas text atau image saja. Dengan pengaturan ini, kandidat dan pelengkapnya akan selalu memiliki modalitas image, text . Kandidat pelengkap diambil dengan menggunakan kandidat asli sebagai kueri (misalnya, _teks kueri -> _gambar kandidat -> _teks kandidat pelengkap ).
Untuk menjalankan evaluasi dalam mode UniRAG ikuti instruksi yang diberikan di atas dengan mengganti InBatch dan inbatch dengan UniRAG dan unirag .

Anda dapat melatih dan mengevaluasi model UniIR CLIP_FF dan BLIP_SF dengan memodifikasi skrip yang sesuai.

Kebun Binatang Model

Kami menyediakan pos pemeriksaan model UniIR di ? Pos pemeriksaan . Anda dapat langsung menggunakan pos pemeriksaan untuk tugas pengambilan atau menyempurnakan model untuk tugas pengambilan Anda sendiri.

Pos Pemeriksaan yang Tersedia

Nama Model	Versi	Ukuran Model	Tautan Model
UniIR (KLIP-SF)	Besar	5,13 GB	Tautan Unduh
UniIR (BLIP-FF)	Besar	7,49 GB	Tautan Unduh

Anda dapat mengunduhnya dengan

 git clone https://huggingface.co/TIGER-Lab/UniIR

Kutipan dan Kontak

Cong Wei: [email protected]
Yang Chen: [email protected]
Alan Ritter: [email protected]
Wenhu Chen: [email protected]

BibTeX:

UniIR, title={ UniIR : Training and benchmarking universal multimodal information retrievers}, author={Wei, Cong and Chen, Yang and Chen, Haonan and Hu, Hexiang and Zhang, Ge and Fu, Jie and Ritter, Alan and Chen, Wenhu}, journal={arXiv preprint arXiv:2311.17136}, year={2023} }">

 @article { wei2023 UniIR ,
  title = { UniIR : Training and benchmarking universal multimodal information retrievers } ,
  author = { Wei, Cong and Chen, Yang and Chen, Haonan and Hu, Hexiang and Zhang, Ge and Fu, Jie and Ritter, Alan and Chen, Wenhu } ,
  journal = { arXiv preprint arXiv:2311.17136 } ,
  year = { 2023 }
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2024-12-30
ukuran 50MB
Berasal dari Github

Aplikasi Terkait

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua