Unduh FollowIR - Unduh kode Sumber FollowIR

FollowIR

Kode sumber lainnya

1.0.0

Unduh

FollowIR: Mengevaluasi dan Mengajarkan Model Pengambilan Informasi untuk Mengikuti Instruksi

Repositori resmi untuk makalah FollowIR: Mengevaluasi dan Mengajarkan Model Pengambilan Informasi untuk Mengikuti Instruksi. Evaluasi resmi dapat dilakukan dengan menginstal perpustakaan mteb dan mengevaluasi model kompatibel MTEB Anda tanpa perubahan (atau hanya beberapa) baris kode!

Tautan

Biner	Keterangan
IkutiIR-7B	Model parameter 7B yang melakukan pemeringkatan ulang dokumen berdasarkan kueri dan instruksi. Ini disempurnakan dari Mistral-7B pada kumpulan data di bawah
Ikuti kereta IR	Dataset yang digunakan untuk melatih FollowIR-7B. Ini terdiri dari instruksi dan kueri TREC, dan dokumen sintetis yang dihasilkan GPT yang telah difilter.
IkutiIR-kereta-mentah	Versi set kereta yang telah difilter sebelumnya di atas. Ini tidak digunakan dalam pelatihan model karena beberapa data yang dihasilkan GPT salah.

Anda juga dapat menemukan data pengujian beranotasi individual (Robust04, Core17, dan News21) meskipun formatnya paling baik digunakan dengan kode evaluasi MTEB.

Instalasi

Jika Anda ingin mereproduksi eksperimen di makalah, Anda dapat menggunakan kode berikut:

git clone https://github.com/orionw/FollowIR.git
cd FollowIR/
conda create -n followir python=3.9 -y
conda activate followir
pip install -r requirements.txt
bash launch_all_jobs.sh

Penggunaan

Jika model Anda kompatibel SentenceTransformer dan tidak memerlukan token khusus untuk menggabungkan kueri dan instruksi, Anda cukup menggunakan perintah satu baris berikut:

mteb -m $MODEL_NAME -t $DATASET

untuk setiap set data di {Robust04InstructionRetrieval, Core17InstructionRetrieval, News21InstructionRetrieval}

Jika Anda memiliki model bi-encoder tetapi ingin melakukan sesuatu yang berbeda dari sekadar menambahkan instruksi ke kueri dengan spasi, Anda dapat memperluas DenseRetrievalExactSearch dan memeriksa instructions di kwargs. Lihat (lihat models/base_sentence_transformers/ sebagai tempat awal untuk modifikasi kecil dan models/e5/ untuk contoh dengan modifikasi yang lebih besar).

Penggunaan Reranker

Reranker kini telah ditambahkan ke MTEB! Jika Anda menggunakan model reranker, Anda perlu memperluas kelas DenseRetrievalExactSearch dan menentukan fungsi __init__ dan predict (lihat bagian model/reranker untuk berbagai contoh reranker). Fungsi prediksi Anda harus menggunakan input_to_rerank yang akan berupa tupel dalam bentuk:

 # if there are no instructions, instructions will be a list of Nones
# Instructions will be present for all of the FollowIR datasets
queries , passages , instructions = list ( zip ( * input_to_rerank ))

Fungsi predict Anda harus menggunakan ini dan mengembalikan daftar yang berisi skor untuk setiap item tupel.

Mengutip

Jika Anda merasa kode, data, atau model ini berguna, silakan mengutip:

 @misc { weller2024followir ,
      title = { FollowIR: Evaluating and Teaching Information Retrieval Models to Follow Instructions } , 
      author = { Orion Weller and Benjamin Chang and Sean MacAvaney and Kyle Lo and Arman Cohan and Benjamin Van Durme and Dawn Lawrie and Luca Soldaini } ,
      year = { 2024 } ,
      eprint = { 2403.15246 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { cs.IR }
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2024-12-26
ukuran 83.12MB
Berasal dari Github

Aplikasi Terkait

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
SmartTube

Kode sumber lainnya

24.71 Stable
Sunamu

Kode sumber lainnya

Release 2.2.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua