تنسيق ملف الفهرس المشترك CIFF هو تنسيق تبادل فهرس مقلوب كما هو محدد كجزء من مبادرة تحدي تكرار IR مفتوح المصدر (OSIRRC).
يستضيف Ciff Hub العديد من الفهارس والاستعلامات لمجموعة متنوعة من المجموعات والنماذج.
تتكون مجموعة بيانات تصنيف مرور MS Marco من 8.8 مليون مقطع.
لاسانس، كارلوس، وستيفان كلينشانت. "دراسة كفاءة النماذج المسطحة." وقائع المؤتمر الدولي الخامس والأربعين لـ ACM SIGIR حول البحث والتطوير في مجال استرجاع المعلومات. 2022.
اسم | وصف | معرض الأثاث الدولي الصيني | ديف | دي ال 2019 | دي ال 2020 |
---|---|---|---|---|---|
المتنزه | تم إعادة ترتيب efficient-splade-V-large-doc مع BP | تحميل | تحميل | تحميل | تحميل |
سبليد | تم إعادة ترتيب splade-cocondenser-ensemble distil مع BP | تحميل | تحميل | تحميل | تحميل |
جيمي لين وXueguang ما. بعض الملاحظات الموجزة عن DeepImpact وCOIL والإطار المفاهيمي لتقنيات استرجاع المعلومات. أرخايف:2106.14807.
اسم | وصف | معرض الأثاث الدولي الصيني | ديف | دي ال 2019 | دي ال 2020 |
---|---|---|---|---|---|
uniCOIL-TILDE | تمت إعادة ترتيب uniCOIL مع توسعة TILDE مع BP | تحميل | تحميل | تحميل | تحميل |
يو وبوكسوان وأنطونيو ماليا وماتياس بيتري. "تحسين الاسترجاع المتفرق المكتسب باستخدام المفردات الخاصة بالمتن." arXiv طبعة أولية arXiv:2401.06703 (2024).
اسم | وصف | معرض الأثاث الدولي الصيني | ديف | دي ال 2019 | دي ال 2020 |
---|---|---|---|---|---|
CSV-30k | تمت إعادة ترتيب csv-30k مع BP | تحميل | تحميل | تحميل | تحميل |
CSV-100k | تم إعادة ترتيب csv-100k مع BP | تحميل | تحميل | تحميل | تحميل |
CSV-300k | تمت إعادة ترتيب csv-300k مع BP | تحميل | تحميل | تحميل | تحميل |