Common Index File Format CIFF は、Open-Source IR Replicaability Challenge (OSIRRC) イニシアチブの一部として定義された逆索引交換形式です。
Ciff Hub は、さまざまなコレクションやモデルの多くのインデックスとクエリをホストします。
MS Marco パッセージ ランキング データセットは、880 万のパッセージで構成されています。
ラサンス、カルロス、ステファン・クリンシャン。 「スプリードモデルの効率研究」情報検索の研究開発に関する第 45 回国際 ACM SIGIR 会議の議事録。 2022年。
名前 | 説明 | CIFF | 開発者 | DL2019 | DL2020 |
---|---|---|---|---|---|
エスプレイド | BP を使用してefficient-splade-V-large-doc 並べ替えました | ダウンロード | ダウンロード | ダウンロード | ダウンロード |
スプレッド | splade-cocondenser-ensemble distil を BP で再順序付け | ダウンロード | ダウンロード | ダウンロード | ダウンロード |
ジミー・リンとシュエグアン・マー。 DeepImpact、COIL、および情報検索技術の概念フレームワークに関するいくつかの簡単なメモ。 arXiv:2106.14807。
名前 | 説明 | CIFF | 開発者 | DL2019 | DL2020 |
---|---|---|---|---|---|
uniCOIL-チルド | BP を使用して TILDE 展開を使用して再順序付けされた uniCOIL | ダウンロード | ダウンロード | ダウンロード | ダウンロード |
ユウ、プシュアン、アントニオ・マリア、マティアス・ペトリ。 「コーパス固有の語彙による学習済みスパース検索の改善」 arXiv プレプリント arXiv:2401.06703 (2024)。
名前 | 説明 | CIFF | 開発者 | DL2019 | DL2020 |
---|---|---|---|---|---|
CSV-30k | csv-30k BP とともに再注文しました | ダウンロード | ダウンロード | ダウンロード | ダウンロード |
CSV-100k | csv-100k BP とともに再注文しました | ダウンロード | ダウンロード | ダウンロード | ダウンロード |
CSV-300k | csv-300k BP 付きで再注文 | ダウンロード | ダウンロード | ダウンロード | ダウンロード |