Das Common Index File Format CIFF ist ein invertiertes Index-Austauschformat, wie es im Rahmen der Open-Source IR Replicability Challenge (OSIRRC)-Initiative definiert wurde.
Der Ciff Hub hostet viele Indizes und Abfragen für eine Vielzahl von Sammlungen und Modellen.
Der MS Marco-Passagenranking-Datensatz besteht aus 8,8 Millionen Passagen.
Lassance, Carlos und Stéphane Clinchant. „Eine Effizienzstudie für Splade-Modelle.“ Vorträge der 45. Internationalen ACM SIGIR-Konferenz zu Forschung und Entwicklung im Bereich Information Retrieval. 2022.
Name | Beschreibung | CIFF | Entwickler | DL 2019 | DL 2020 |
---|---|---|---|---|---|
ESPLADE | efficient-splade-V-large-doc wurde mit BP neu angeordnet | Herunterladen | Herunterladen | Herunterladen | Herunterladen |
SPLADE | splade-cocondenser-ensemble distil mit BP neu bestellt | Herunterladen | Herunterladen | Herunterladen | Herunterladen |
Jimmy Lin und Xueguang Ma. Ein paar kurze Anmerkungen zu DeepImpact, COIL und einem konzeptionellen Rahmen für Informationsabruftechniken. arXiv:2106.14807.
Name | Beschreibung | CIFF | Entwickler | DL 2019 | DL 2020 |
---|---|---|---|---|---|
uniCOIL-TILDE | uniCOIL mit TILDE-Erweiterung mit BP neu angeordnet | Herunterladen | Herunterladen | Herunterladen | Herunterladen |
Yu, Puxuan, Antonio Mallia und Matthias Petri. „Verbessertes erlerntes Sparse-Retrieval mit korpusspezifischen Vokabularien.“ arXiv-Vorabdruck arXiv:2401.06703 (2024).
Name | Beschreibung | CIFF | Entwickler | DL 2019 | DL 2020 |
---|---|---|---|---|---|
CSV-30k | csv-30k mit BP neu bestellt | Herunterladen | Herunterladen | Herunterladen | Herunterladen |
CSV-100k | csv-100k mit BP neu bestellt | Herunterladen | Herunterladen | Herunterladen | Herunterladen |
CSV-300k | csv-300k mit BP neu bestellt | Herunterladen | Herunterladen | Herunterladen | Herunterladen |