공통 인덱스 파일 형식 CIFF는 OSIRRC(Open-Source IR Replicability Challenge) 이니셔티브의 일부로 정의된 역 인덱스 교환 형식입니다.
Ciff Hub는 다양한 컬렉션과 모델에 대한 많은 인덱스와 쿼리를 호스팅합니다.
MS Marco 구절 순위 데이터 세트는 880만 개의 구절로 구성됩니다.
Lassance, Carlos 및 Stéphane Clinchant. "스플레이드 모델에 대한 효율성 연구." 정보 검색 연구 및 개발에 관한 제45차 국제 ACM SIGIR 컨퍼런스 간행물. 2022.
이름 | 설명 | CIFF | 데브 | DL 2019 | DL 2020 |
---|---|---|---|---|---|
에스플레이드 | efficient-splade-V-large-doc BP와 함께 재정렬되었습니다. | 다운로드 | 다운로드 | 다운로드 | 다운로드 |
스플레이드 | BP로 재주문된 splade-cocondenser-ensemble distil | 다운로드 | 다운로드 | 다운로드 | 다운로드 |
지미 린과 Xueguang Ma. DeepImpact, COIL 및 정보 검색 기술을 위한 개념적 프레임워크에 대한 몇 가지 간략한 참고 사항입니다. arXiv:2106.14807.
이름 | 설명 | CIFF | 데브 | DL 2019 | DL 2020 |
---|---|---|---|---|---|
유니코일-틸드 | TILDE 확장이 포함된 uniCOIL이 BP로 재정렬됨 | 다운로드 | 다운로드 | 다운로드 | 다운로드 |
Yu, Puxuan, Antonio Mallia, Matthias Petri. "코퍼스별 어휘를 사용하여 학습된 희소 검색이 향상되었습니다." arXiv 사전 인쇄 arXiv:2401.06703 (2024).
이름 | 설명 | CIFF | 데브 | DL 2019 | DL 2020 |
---|---|---|---|---|---|
CSV-30,000 | csv-30k BP와 함께 재주문됨 | 다운로드 | 다운로드 | 다운로드 | 다운로드 |
CSV-100,000 | BP를 포함하여 csv-100k 재정렬됨 | 다운로드 | 다운로드 | 다운로드 | 다운로드 |
CSV-300k | csv-300k BP와 함께 재주문되었습니다. | 다운로드 | 다운로드 | 다운로드 | 다운로드 |