Общий формат индексных файлов CIFF — это инвертированный формат обмена индексами, определенный в рамках инициативы Open-Source IR Replicability Challenge (OSIRRC).
В Ciff Hub размещено множество индексов и запросов для различных коллекций и моделей.
Набор данных ранжирования отрывков MS Marco состоит из 8,8 млн отрывков.
Лассанс, Карлос и Стефан Клиншан. «Исследование эффективности моделей лопаток». Материалы 45-й Международной конференции ACM SIGIR по исследованиям и разработкам в области информационного поиска. 2022.
Имя | Описание | КИФФ | Дев | ДЛ 2019 | ДЛ 2020 |
---|---|---|---|---|---|
ЭСПЛАДЕ | efficient-splade-V-large-doc переупорядочен с BP | Скачать | Скачать | Скачать | Скачать |
СПЛАД | splade-cocondenser-ensemble distil переупорядочен с BP | Скачать | Скачать | Скачать | Скачать |
Джимми Лин и Сюэгуан Ма. Несколько кратких заметок о DeepImpact, COIL и концептуальной основе методов поиска информации. arXiv: 2106.14807.
Имя | Описание | КИФФ | Дев | ДЛ 2019 | ДЛ 2020 |
---|---|---|---|---|---|
uniCOIL-ТИЛЬДА | uniCOIL с расширением TILDE переупорядочен с BP | Скачать | Скачать | Скачать | Скачать |
Ю, Пусюань, Антонио Маллиа и Матиас Петри. «Улучшенный выученный разреженный поиск с помощью корпусных словарей». Препринт arXiv arXiv:2401.06703 (2024).
Имя | Описание | КИФФ | Дев | ДЛ 2019 | ДЛ 2020 |
---|---|---|---|---|---|
CSV-30к | csv-30k переупорядочен с BP | Скачать | Скачать | Скачать | Скачать |
CSV-100к | csv-100k переупорядочен с BP | Скачать | Скачать | Скачать | Скачать |
CSV-300к | csv-300k переупорядочен с BP | Скачать | Скачать | Скачать | Скачать |