Common Index File Format CIFF est un format d'échange d'index inversé tel que défini dans le cadre de l'initiative Open-Source IR Replicaability Challenge (OSIRRC).
Le Ciff Hub héberge de nombreux index et requêtes pour une variété de collections et de modèles.
L'ensemble de données de classement des passages MS Marco comprend 8,8 millions de passages.
Lassance, Carlos et Stéphane Clinchant. "Une étude d'efficacité pour les modèles spade." Actes de la 45e Conférence internationale ACM SIGIR sur la recherche et le développement en recherche d'information. 2022.
Nom | Description | CIF | Développeur | DL 2019 | DL 2020 |
---|---|---|---|---|---|
ESPLADE | efficient-splade-V-large-doc réorganisé avec BP | Télécharger | Télécharger | Télécharger | Télécharger |
SPLADE | splade-cocondenser-ensemble distil réorganisé avec BP | Télécharger | Télécharger | Télécharger | Télécharger |
Jimmy Lin et Xueguang Ma. Quelques brèves notes sur DeepImpact, COIL et un cadre conceptuel pour les techniques de recherche d'informations. arXiv :2106.14807.
Nom | Description | CIF | Développeur | DL 2019 | DL 2020 |
---|---|---|---|---|---|
uniCOIL-TILDE | uniCOIL avec extension TILDE commandé avec BP | Télécharger | Télécharger | Télécharger | Télécharger |
Yu, Puxuan, Antonio Mallia et Matthias Petri. "Récupération éparse apprise améliorée avec des vocabulaires spécifiques au corpus." Préimpression arXiv arXiv :2401.06703 (2024).
Nom | Description | CIF | Développeur | DL 2019 | DL 2020 |
---|---|---|---|---|---|
CSV-30k | csv-30k récommandé avec BP | Télécharger | Télécharger | Télécharger | Télécharger |
CSV-100k | csv-100k récommandé avec BP | Télécharger | Télécharger | Télécharger | Télécharger |
CSV-300k | csv-300k récommandé avec BP | Télécharger | Télécharger | Télécharger | Télécharger |