Formato de archivo de índice común CIFF es un formato de intercambio de índice invertido, tal como se define como parte de la iniciativa Open-Source IR Replicability Challenge (OSIRRC).
Ciff Hub alberga muchos índices y consultas para una variedad de colecciones y modelos.
El conjunto de datos de clasificación de pasajes de MS Marco consta de 8,8 millones de pasajes.
Lassance, Carlos y Stéphane Clintont. "Un estudio de eficiencia para modelos splade". Actas de la 45ª Conferencia Internacional ACM SIGIR sobre Investigación y Desarrollo en Recuperación de Información. 2022.
Nombre | Descripción | CIF | desarrollador | Licenciatura 2019 | Licencia de Licencia 2020 |
---|---|---|---|---|---|
ESPLADURA | efficient-splade-V-large-doc reordenado con BP | Descargar | Descargar | Descargar | Descargar |
ESPALA | splade-cocondenser-ensemble distil reordenado con BP | Descargar | Descargar | Descargar | Descargar |
Jimmy Lin y Xueguang Ma. Algunas notas breves sobre DeepImpact, COIL y un marco conceptual para técnicas de recuperación de información. arXiv:2106.14807.
Nombre | Descripción | CIF | desarrollador | Licenciatura 2019 | Licencia de Licencia 2020 |
---|---|---|---|---|---|
uniCOIL-TILDE | uniCOIL con expansión TILDE reordenada con BP | Descargar | Descargar | Descargar | Descargar |
Yu, Puxuan, Antonio Mallia y Matthias Petri. "Recuperación escasa aprendida mejorada con vocabularios específicos del corpus". Preimpresión de arXiv arXiv:2401.06703 (2024).
Nombre | Descripción | CIF | desarrollador | Licenciatura 2019 | Licencia de Licencia 2020 |
---|---|---|---|---|---|
CSV-30k | csv-30k reordenado con BP | Descargar | Descargar | Descargar | Descargar |
CSV-100k | csv-100k reordenado con BP | Descargar | Descargar | Descargar | Descargar |
CSV-300k | csv-300k reordenado con BP | Descargar | Descargar | Descargar | Descargar |