Format File Indeks Umum CIFF adalah format pertukaran indeks terbalik sebagaimana didefinisikan sebagai bagian dari inisiatif Open-Source IR Replicability Challenge (OSIRRC).
Ciff Hub menampung banyak indeks dan kueri untuk berbagai koleksi dan model.
Kumpulan data peringkat bagian MS Marco terdiri dari 8,8 juta bagian.
Lassance, Carlos, dan Stéphane Clinchant. "Studi efisiensi untuk model splade." Prosiding Konferensi Internasional ACM SIGIR ke-45 tentang Penelitian dan Pengembangan Pencarian Informasi. 2022.
Nama | Keterangan | CIFF | Dev | DL 2019 | DL 2020 |
---|---|---|---|---|---|
ESPLADE | efficient-splade-V-large-doc disusun ulang dengan BP | Unduh | Unduh | Unduh | Unduh |
SPLADE | splade-cocondenser-ensemble distil disusun ulang dengan BP | Unduh | Unduh | Unduh | Unduh |
Jimmy Lin dan Xueguang Ma. Beberapa Catatan Singkat tentang DeepImpact, COIL, dan Kerangka Konseptual Teknik Pengambilan Informasi. arXiv:2106.14807.
Nama | Keterangan | CIFF | Dev | DL 2019 | DL 2020 |
---|---|---|---|---|---|
uniCOIL-TILDE | uniCOIL dengan ekspansi TILDE disusun ulang dengan BP | Unduh | Unduh | Unduh | Unduh |
Yu, Puxuan, Antonio Mallia, dan Matthias Petri. "Peningkatan Pengambilan Jarang yang Dipelajari dengan Kosakata Khusus Corpus." arXiv pracetak arXiv:2401.06703 (2024).
Nama | Keterangan | CIFF | Dev | DL 2019 | DL 2020 |
---|---|---|---|---|---|
CSV-30k | csv-30k dipesan ulang dengan BP | Unduh | Unduh | Unduh | Unduh |
CSV-100rb | csv-100k dipesan ulang dengan BP | Unduh | Unduh | Unduh | Unduh |
CSV-300k | csv-300k dipesan ulang dengan BP | Unduh | Unduh | Unduh | Unduh |