anserini Download - anserini Quellcode herunterladen

anserini

Anderer Quellcode

Herunterladen

Anserini

Anserini ist ein Toolkit für die reproduzierbare Informationsbeschaffungsforschung. Indem wir auf Lucene aufbauen, wollen wir die Lücke zwischen akademischer Information-Retrieval-Forschung und der Praxis der Erstellung realer Suchanwendungen schließen. Unsere Bemühungen zielen unter anderem darauf ab, das Gegenteil davon zu sein.* Anserini entstand aus einer Reproduzierbarkeitsstudie verschiedener Open-Source-Retrieval-Engines im Jahr 2016 (Lin et al., ECIR 2016). Siehe Yang et al. (SIGIR 2017) und Yang et al. (JDIQ 2018) für Übersichten.

❗ Anserini wurde beim Commit 272565 (03.04.2024) von JDK 11 auf JDK 21 aktualisiert, was der Veröffentlichung von v0.35.0 entspricht.

? Probieren Sie es aus!

Anserini ist in einem eigenständigen Fatjar verpackt, was auch den einfachsten Einstieg bietet. Vorausgesetzt, Sie haben Java bereits installiert, rufen Sie das Fatjar ab:

wget https://repo1.maven.org/maven2/io/anserini/anserini/0.38.0/anserini-0.38.0-fatjar.jar

Die folgenden Befehle generieren einen SPLADE++ ED-Lauf mit den Entwicklungsabfragen (codiert mit ONNX) im MS MARCO-Passagenkorpus:

java -cp anserini-0.38.0-fatjar.jar io.anserini.search.SearchCollection 
  -index msmarco-v1-passage.splade-pp-ed 
  -topics msmarco-v1-passage.dev 
  -encoder SpladePlusPlusEnsembleDistil 
  -output run.msmarco-v1-passage-dev.splade-pp-ed-onnx.txt 
  -impact -pretokenized

Zur Bewertung:

java -cp anserini-0.38.0-fatjar.jar trec_eval -c -M 10 -m recip_rank msmarco-passage.dev-subset run.msmarco-v1-passage-dev.splade-pp-ed-onnx.txt

Sehen Sie sich detaillierte Anweisungen für die aktuelle Fatjar-Version von Anserini (v0.38.0) an, um Regressionsexperimente für die MS MARCO V2.1-Korpora für TREC 2024 RAG, für MS MARCO V1 Passage und für BEIR zu reproduzieren, alles direkt aus dem Fatjar!

Außerdem verfügt Anserini über eine integrierte Webanwendung für interaktive Abfragen sowie eine REST-API, die von anderen Anwendungen verwendet werden kann. Schauen Sie sich hier unsere Dokumentation an.

Ältere Anleitungen

Anserini v0.37.0
Anserini v0.36.1
Anserini v0.36.0
Anserini v0.35.1
Anserini v0.35.0

? Installation

Die meisten Anserini-Funktionen werden in der Pyserini-Python-Schnittstelle verfügbar gemacht. Wenn Sie sich mit Python besser auskennen, beginnen Sie dort, obwohl Anserini einen wichtigen Baustein von Pyserini darstellt und es sich daher weiterhin lohnt, etwas über Anserini zu lernen.

Sie benötigen Java 21 und Maven 3.9+, um Anserini zu erstellen. Klonen Sie unser Repo mit der Option --recurse-submodules um sicherzustellen, dass das eval/ -Submodul ebenfalls geklont wird (alternativ verwenden Sie git submodule update --init ). Dann erstellen Sie mit Maven:

 mvn clean package

Das tools/ -Verzeichnis, das Evaluierungstools und andere Skripte enthält, ist eigentlich dieses Repo, integriert als Git-Submodul (so dass es von verwandten Projekten gemeinsam genutzt werden kann). Erstellen Sie wie folgt (möglicherweise erhalten Sie Warnungen, die Sie aber ignorieren können):

 cd tools/eval && tar xvfz trec_eval.9.0.4.tar.gz && cd trec_eval.9.0.4 && make && cd ../../..
cd tools/eval/ndeval && make && cd ../../..

Damit sollten Sie startklar sein. Der Onboarding-Pfad für Anserini beginnt hier!

Windows-Tipps

Wenn Sie Windows verwenden, verwenden Sie bitte WSL2, um Anserini zu erstellen. Informationen zur Installation von WSL2 finden Sie im WSL2-Installationsdokument, falls Sie dies noch nicht getan haben.

Beachten Sie, dass Tests unter Windows ohne WSL2 aufgrund von Codierungsproblemen möglicherweise fehlschlagen, siehe #1466. Eine einfache Problemumgehung besteht darin, Tests zu überspringen, indem Sie -Dmaven.test.skip=true zum obigen mvn -Befehl hinzufügen. Weitere Diskussionen zum Debuggen von Windows-Build-Fehlern finden Sie unter #1121.

⚗️ End-to-End-Regressionsexperimente

Anserini wurde entwickelt, um End-to-End-Experimente mit verschiedenen Standard-IR-Testsammlungen sofort zu unterstützen. Jede dieser End-to-End -Regressionen beginnt mit dem Rohkorpus, erstellt den erforderlichen Index, führt Abrufläufe durch und generiert Auswertungsergebnisse. Einzelheiten finden Sie auf den einzelnen Seiten.

MS MARCO V1 Passage-Regressionen

	Entwickler	DL19	DL20
Unbeaufsichtigt Sparse
Lucene BoW-Grundlinien	?	?	?
Quantisierter BM25	?	?	?
WordPiece-Grundlinien (vorab tokenisiert)	?	?	?
WordPiece-Grundlinien (Huggingface)	?	?	?
WordPiece + Lucene BoW-Grundlinien	?	?	?
doc2query	?
doc2query-T5	?	?	?
Learned Sparse (uniCOIL-Familie)
uniCOIL noexp	?	?	?
uniCOIL mit doc2query-T5	?	?	?
uniCOIL mit TILDE	?
Sparse gelernt (andere)
DeepImpact	?
SPLADEv2	?
SPLADE++ CoCondenser-EnsembleDistil	? ?️	? ?️	? ?️
SPLADE++ CoCondenser-SelfDistil	? ?️	? ?️	? ?️
Learned Dense (HNSW-Indizes)
cosDPR-destill	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
BGE-base-en-v1.5	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
OpenAI Ada2	voll:? int8:?	voll:? int8:?	voll:? int8:?
Cohere Englisch v3.0	voll:? int8:?	voll:? int8:?	voll:? int8:?
Gelernte Dichte (flache Indizes)
cosDPR-destill	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
BGE-base-en-v1.5	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
OpenAI Ada2	voll:? int8:?️	voll:? int8:?	voll:? int8:?
Cohere Englisch v3.0	voll:? int8:?	voll:? int8:?	voll:? int8:?
Gelernte Dichte (Invertiert; experimentell)
cosDPR-destil mit „falschen Worten“	?	?	?
cosDPR-Destillation mit „LexLSH“	?	?	?

Schlüssel:

? = Stichwortabfragen
„full“ = volle 32-Bit-Floating-Genauigkeit
„int8“ = quantisierte 8-Bit-Präzision
? = zwischengespeicherte Abfragen, ?️ = Abfragekodierung mit ONNX

Verfügbare Korpora zum Download

Korpora	Größe	Prüfsumme
Quantisierter BM25	1,2 GB	`0a623e2c97ac6b7e814bf1323a97b435`
uniCOIL (noexp)	2,7 GB	`f17ddd8c7c00ff121c3c3b147d2e17d8`
uniCOIL (d2q-T5)	3,4 GB	`78eef752c78c8691f7d61600ceed306f`
uniCOIL (TILDE)	3,9 GB	`12a9c289d94e32fd63a7d39c9677d75c`
DeepImpact	3,6 GB	`73843885b503af3c8b3ee62e5f5a9900`
SPLADEv2	9,9 GB	`b5d126f5d9a8e1b3ef3f5cb0ba651725`
SPLADE++ CoCondenser-EnsembleDistil	4,2 GB	`e489133bdc54ee1e7c62a32aa582bc77`
SPLADE++ CoCondenser-SelfDistil	4,8 GB	`cb7e264222f2bf2221dd2c9d28190be1`
cosDPR-destill	57 GB	`e20ffbc8b5e7f760af31298aefeaebbd`
BGE-base-en-v1.5	59 GB	`353d2c9e72e858897ad479cca4ea0db1`
OpenAI-ada2	109 GB	`a4d843d522ff3a3af7edbee789a63402`
Cohere embed-english-v3.0	38 GB	`06a6e38a0522850c6aa504db7b2617f5`

MS MARCO V1 Dokumentregressionen

	Entwickler	DL19	DL20
Unbeaufsichtigtes Lexikon, vollständiges Dokument *
Lucene BoW-Grundlinien	+	+	+
WordPiece-Grundlinien (vorab tokenisiert)	+	+	+
WordPiece-Grundlinien (Huggingface-Tokenizer)	+	+	+
WordPiece + Lucene BoW-Grundlinien	+	+	+
doc2query-T5	+	+	+
Unbeaufsichtigtes lexikalisches, segmentiertes Dokument *
Lucene BoW-Grundlinien	+	+	+
WordPiece-Grundlinien (vorab tokenisiert)	+	+	+
WordPiece + Lucene BoW-Grundlinien	+	+	+
doc2query-T5	+	+	+
Sparse-Lexika gelernt
uniCOIL noexp	✓	✓	✓
uniCOIL mit doc2query-T5	✓	✓	✓

Verfügbare Korpora zum Download

Korpora	Größe	Prüfsumme
MS MARCO V1-Dokument: uniCOIL (noexp)	11 GB	`11b226e1cacd9c8ae0a660fd14cdd710`
MS MARCO V1 Dokument: uniCOIL (d2q-T5)	19 GB	`6a00e2c0c375cb1e52c83ae5ac377ebb`

MS MARCO V2 Passage-Regressionen

	Entwickler	DL21	DL22	DL23
Unbeaufsichtigtes Lexikon, Originalkorpus
Grundlinien	+	+	+	+
doc2query-T5	+	+	+	+
Unbeaufsichtigter lexikalischer, erweiterter Korpus
Grundlinien	+	+	+	+
doc2query-T5	+	+	+	+
Sparse-Lexika gelernt
uniCOIL noexp Zero-Shot	✓	✓	✓	✓
uniCOIL mit doc2query-T5 Zero-Shot	✓	✓	✓	✓
SPLADE++ CoCondenser-EnsembleDistil (zwischengespeicherte Abfragen)	✓	✓	✓	✓
SPLADE++ CoCondenser-EnsembleDistil (ONNX)	✓	✓	✓	✓
SPLADE++ CoCondenser-SelfDistil (zwischengespeicherte Abfragen)	✓	✓	✓	✓
SPLADE++ CoCondenser-SelfDistil (ONNX)	✓	✓	✓	✓

Verfügbare Korpora zum Download

Korpora	Größe	Prüfsumme
uniCOIL (noexp)	24 GB	`d9cc1ed3049746e68a2c91bf90e5212d`
uniCOIL (d2q-T5)	41 GB	`1949a00bfd5e1f1a230a04bbc1f01539`
SPLADE++ CoCondenser-EnsembleDistil	66 GB	`2cdb2adc259b8fa6caf666b20ebdc0e8`
SPLADE++ CoCondenser-SelfDistil	76 GB	`061930dd615c7c807323ea7fc7957877`

MS MARCO V2 Dokumentregressionen

	Entwickler	DL21	DL22	DL23
Unbeaufsichtigtes Lexikon, vollständiges Dokument
Grundlinien	+	+	+	+
doc2query-T5	+	+	+	+
Unbeaufsichtigtes lexikalisches, segmentiertes Dokument
Grundlinien	+	+	+	+
doc2query-T5	+	+	+	+
Sparse-Lexika gelernt
uniCOIL noexp Zero-Shot	✓	✓	✓	✓
uniCOIL mit doc2query-T5 Zero-Shot	✓	✓	✓	✓

Verfügbare Korpora zum Download

Korpora	Größe	Prüfsumme
MS MARCO V2-Dokument: uniCOIL (noexp)	55 GB	`97ba262c497164de1054f357caea0c63`
MS MARCO V2 Dokument: uniCOIL (d2q-T5)	72 GB	`c5639748c2cbad0152e10b0ebde3b804`

MS MARCO V2.1 Dokumentregressionen

Die MS MARCO V2.1-Korpora wurden aus den V2-Korpora für den TREC 2024 RAG Track abgeleitet. Die folgenden Experimente erfassen Themen und QRels, die ursprünglich auf die V2-Korpora abzielten, aber auf die V2.1-Korpora „projiziert“ wurden.

	Entwickler	DL21	DL22	DL23	RAGgy-Entwickler
Unbeaufsichtigtes Lexikon, vollständiges Dokument
Grundlinien	+	+	+	+	+
Unbeaufsichtigtes lexikalisches, segmentiertes Dokument
Grundlinien	+	+	+	+	+

BEIR (v1.0.0) Regressionen

Schlüssel:

F1 = „flache“ Basislinie (Lucene-Analysator), Schlüsselwortabfragen (?)
F2 = „flache“ Basislinie (vorab tokenisiert mit bert-base-uncased Tokenizer), Schlüsselwortabfragen (?)
MF = „Multifield“-Basislinie (Lucene-Analysator), Schlüsselwortabfragen (?)
U1 = uniCOIL (noexp), zwischengespeicherte Abfragen (?)
S1 = SPLADE++ CoCondenser-EnsembleDistil: zwischengespeicherte Abfragen (?), ONNX ( ?️ )
BGE (flach) = BGE-base-en-v1.5 (flache Indizes)
- Original-Indizes (float32): zwischengespeicherte Abfragen (?), ONNX ( ?️ )
- quantisierte (int8) Indizes: zwischengespeicherte Abfragen (?), ONNX ( ?️ )
BGE (HNSW) = BGE-base-en-v1.5 (HNSW-Indizes)
- Original-Indizes (float32): zwischengespeicherte Abfragen (?), ONNX ( ?️ )
- quantisierte (int8) Indizes: zwischengespeicherte Abfragen (?), ONNX ( ?️ )

In den Anweisungen unter der Tabelle erfahren Sie, wie Sie die Ergebnisse eines Modells für alle BEIR-Korpora „auf einmal“ reproduzieren.

Korpus	F1	F2	MF	U1	S1	BGE (flach)	BGE (HNSW)
TREC-COVID	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
BioASQ	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
NFCorpus	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
NQ	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
HotpotQA	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
FiQA-2018	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
Signal-1M(RT)	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
TREC-NEWS	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
Robust04	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
ArguAna	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
Touche2020	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Android	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Englisch	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Gaming	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Gis	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Mathematica	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Physik	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Programmierer	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Statistiken	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Tex	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Unix	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Webmaster	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
CQADupStack-Wordpress	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
Quora	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
DBPedia	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
SCIDOCS	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
FIEBER	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
Klimafieber	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️
SciFact	?	?	?	?	? ?️	voll:? ?️ int8:? ?️	voll:? ?️ int8:? ?️

Um die SPLADE++ CoCondenser-EnsembleDistil-Ergebnisse zu reproduzieren, laden Sie zunächst die Sammlung herunter:

wget https://rgw.cs.uwaterloo.ca/pyserini/data/beir-v1.0.0-splade-pp-ed.tar -P collections/
tar xvf collections/beir-v1.0.0-splade-pp-ed.tar -C collections/

Der Tarball ist 42 GB groß und hat die MD5-Prüfsumme 9c7de5b444a788c9e74c340bf833173b . Sobald Sie die Daten entpackt haben, durchlaufen die folgenden Befehle alle BEIR-Korpora und führen die Regressionen aus:

MODEL= " splade-pp-ed " ; CORPORA=(trec-covid bioasq nfcorpus nq hotpotqa fiqa signal1m trec-news robust04 arguana webis-touche2020 cqadupstack-android cqadupstack-english cqadupstack-gaming cqadupstack-gis cqadupstack-mathematica cqadupstack-physics cqadupstack-programmers cqadupstack-stats cqadupstack-tex cqadupstack-unix cqadupstack-webmasters cqadupstack-wordpress quora dbpedia-entity scidocs fever climate-fever scifact) ; for c in " ${CORPORA[@]} "
do
    echo " Running $c ... "
    python src/main/python/run_regression.py --index --verify --search --regression beir-v1.0.0- ${c} . ${MODEL} .onnx > logs/log.beir-v1.0.0- ${c} - ${MODEL} .onnx 2>&1
done

Sie können die Ergebnisse überprüfen, indem Sie die Protokolldateien in logs/ untersuchen.

Für die anderen Modelle ändern Sie die obigen Befehle wie folgt:

Schlüssel	Korpus	Prüfsumme	`MODEL`
F1	`corpus`	`faefd5281b662c72ce03d22021e4ff6b`	`flat`
F2	`corpus-wp`	`3cf8f3dcdcadd49362965dd4466e6ff2`	`flat-wp`
MF	`corpus`	`faefd5281b662c72ce03d22021e4ff6b`	`multifield`
U1	`unicoil-noexp`	`4fd04d2af816a6637fc12922cccc8a83`	`unicoil-noexp`
S1	`splade-pp-ed`	`9c7de5b444a788c9e74c340bf833173b`	`splade-pp-ed`
BGE	`bge-base-en-v1.5`	`e4e8324ba3da3b46e715297407a24f00`	`bge-base-en-v1.5-hnsw`

Das obige „Korpus“ sollte durch den vollständigen Dateinamen beir-v1.0.0-${corpus}.tar ersetzt werden, z. B. beir-v1.0.0-bge-base-en-v1.5.tar . Die oben genannten Befehle sollten mit einigen geringfügigen Änderungen funktionieren: Sie müssen den Parameter --regression anpassen, um ihn an das Schema der YAML-Konfigurationsdateien in src/main/resources/regression/ anzupassen.

Sprachübergreifende und mehrsprachige Regressionen

Regressionen für Mr. TyDi (v1.1) Basislinien: ar, bn, en, fi, id, ja, ko, ru, sw, te, th
Regressionen für MIRACL (v1.0)-Basislinien: ar, bn, en, es, fa, fi, fr, hi, id, ja, ko, ru, sw, te, th, zh
Regressionen für TREC 2022 NeuCLIR Track BM25 (Abfrageübersetzung): Persisch, Russisch, Chinesisch
Regressionen für TREC 2022 NeuCLIR Track BM25 (Dokumentübersetzung): Persisch, Russisch, Chinesisch
Regressionen für TREC 2022 NeuCLIR Track SPLADE (Abfrageübersetzung): Persisch, Russisch, Chinesisch
Regressionen für TREC 2022 NeuCLIR Track SPLADE (Dokumentübersetzung): Persisch, Russisch, Chinesisch
Regressionen für HC4 (v1.0)-Basislinien auf HC4-Korpora: Persisch, Russisch, Chinesisch
Regressionen für HC4 (v1.0)-Basislinien auf ursprünglichen NeuCLIR22-Korpora: Persisch, Russisch, Chinesisch
Regressionen für HC4 (v1.0)-Baselines auf übersetzten NeuCLIR22-Korpora: Persisch, Russisch, Chinesisch
Regressionen für NTCIR-8 ACLIA (IR4QA-Unteraufgabe, einsprachiges Chinesisch)
Regressionen für CLEF 2006 Einsprachiges Französisch
Regressionen für TREC 2002 Monolingual Arabic
Regressionen für einsprachige FIRE 2012-Basislinien: Bengali, Hindi, Englisch
Regressionen für CIRAL (v1.0) BM25 (Abfrageübersetzung): Hausa, Somali, Swahili, Yoruba
Regressionen für CIRAL (v1.0) BM25 (Dokumentübersetzung): Hausa, Somali, Swahili, Yoruba

Andere Regressionen

Regressionen für Datenträger 1 und 2 (TREC 1–3), Datenträger 4 und 5 (TREC 7–8, Robust04), AQUAINT (Robust05)
Regressionen für den New York Times Corpus (Core17), den Washington Post Corpus (Core18)
Regressionen für Wt10g, Gov2
Regressionen für ClueWeb09 (Kategorie B), ClueWeb12-B13, ClueWeb12
Regressionen für Tweets2011 (MB11 und MB12), Tweets2013 (MB13 und MB14)
Regressionen für den Abruf komplexer Antworten (CAR17): v1.5, v2.0, v2.0 mit doc2query
Regressionen für TREC-Nachrichtentitel (Hintergrundverknüpfungsaufgabe): 2018, 2019, 2020
Regressionen zur FEVER-Faktenüberprüfung
Regressionen für DPR-Wikipedia-QA-Grundlinien: 100-Wörter-Aufteilungen, 6/3 Schiebefenstersätze

? Zusätzliche Dokumentation

Die unten beschriebenen Experimente sind nicht mit strengen End-to-End-Regressionstests verbunden und bieten daher einen niedrigeren Standard an Reproduzierbarkeit. In den meisten Fällen ist das manuelle Kopieren und Einfügen von Befehlen in eine Shell erforderlich, um unsere Ergebnisse zu reproduzieren.

MS MARCO V1

Reproduktion der BM25-Basislinien für das MS MARCO Passage Ranking
Reproduktion der BM25-Grundlinien für das MS MARCO Document Ranking
Reproduktion der Grundlinien für das MS MARCO Document Ranking Leaderboard
Reproduktion der doc2query-Ergebnisse (MS MARCO Passage Ranking und TREC-CAR)
Reproduktion von docTTTTTquery-Ergebnissen (MS MARCO Passage and Document Ranking)
Hinweise zu Reproduktionsproblemen mit MS MARCO Document Ranking mit docTTTTTquery

MS MARCO V2

Reproduktion der BM25-Grundlinien auf den MS MARCO V2-Sammlungen

TREC-COVID und CORD-19

Indizierung des offenen Forschungsdatensatzes COVID-19 von AI2
Grundlagen für die TREC-COVID Challenge
Grundlagen für die TREC-COVID Challenge mit doc2query

Andere Experimente und Funktionen

Arbeiten mit dem 20-Newsgroups-Datensatz
Leitfaden zu BM25-Grundlinien für die FEVER-Faktenüberprüfungsaufgabe
Leitfaden zur Reproduktion von „Neural Hype“-Experimenten
Leitfaden zur Durchführung von Experimenten im AI2 Open Research Corpus
Experimente von Yang et al. (JDIQ 2018)
Runbooks für TREC 2018: [Anserini-Gruppe] [h2oloo-Gruppe]
Runbook für ECIR 2019-Papier zum axiomatischen semantischen Begriffsvergleich
Runbook für ECIR 2019-Papier zum sammlungsübergreifenden Relevanz-Feedback
Unterstützung für die Suche nach ungefähren nächsten Nachbarn auf dichten Vektoren mit invertierten Indizes

? Wie kann ich einen Beitrag leisten?

Wenn Sie Anserini als hilfreich empfunden haben, möchten wir Sie ganz einfach um einen Beitrag bitten. Teilen Sie uns im Zuge der Reproduktion der Basisergebnisse für Standardtestsammlungen bitte mit, ob Sie erfolgreich sind, indem Sie uns eine Pull-Anfrage mit einer einfachen Notiz senden, wie sie unten auf der Seite für die Datenträger 4 und 5 angezeigt wird. Reproduzierbarkeit ist wichtig uns, und wir möchten sowohl über Erfolge als auch über Misserfolge Bescheid wissen. Da die Regressionsdokumentation automatisch generiert wird, sollten Pull-Anfragen an die Rohvorlagen gesendet werden. Anschließend kann die Regressionsdokumentation mit dem Skript bin/build.sh generiert werden. Im Gegenzug werden Sie als Mitwirkender anerkannt.

Darüber hinaus gibt es immer offene Fragen, bei denen wir uns über Hilfe freuen würden!

️ Veröffentlichungsverlauf

v0.38.0: 6. September 2024 [Versionshinweise]
v0.37.0: 22. August 2024 [Versionshinweise]
v0.36.1: 23. Mai 2024 [Versionshinweise]
v0.36.0: 28. April 2024 [Versionshinweise]
v0.35.1: 24. April 2024 [Versionshinweise]
v0.35.0: 3. April 2024 [Versionshinweise]
v0.25.0: 27. März 2024 [Versionshinweise]
v0.24.2: 27. Februar 2024 [Versionshinweise]
v0.24.1: 27. Januar 2024 [Versionshinweise]
v0.24.0: 28. Dezember 2023 [Versionshinweise]
v0.23.0: 16. November 2023 [Versionshinweise]
v0.22.1: 18. Oktober 2023 [Versionshinweise]
v0.22.0: 28. August 2023 [Versionshinweise]
v0.21.0: 31. März 2023 [Versionshinweise]
v0.20.0: 20. Januar 2023 [Versionshinweise]

älter... (und historische Notizen)

v0.16.2: 12. Dezember 2022 [Versionshinweise]
v0.16.1: 2. November 2022 [Versionshinweise]
v0.16.0: 23. Oktober 2022 [Versionshinweise]
v0.15.0: 22. September 2022 [Versionshinweise]
v0.14.4: 31. Juli 2022 [Versionshinweise]
v0.14.3: 9. Mai 2022 [Versionshinweise]
v0.14.2: 24. März 2022 [Versionshinweise]
v0.14.1: 27. Februar 2022 [Versionshinweise]
v0.14.0: 10. Januar 2022 [Versionshinweise]
v0.13.5: 2. November 2021 [Versionshinweise]
v0.13.4: 22. Oktober 2021 [Versionshinweise]
v0.13.3: 22. August 2021 [Versionshinweise]
v0.13.2: 20. Juli 2021 [Versionshinweise]
v0.13.1: 29. Juni 2021 [Versionshinweise]
v0.13.0: 22. Juni 2021 [Versionshinweise]
v0.12.0: 29. April 2021 [Versionshinweise]
v0.11.0: 13. Februar 2021 [Versionshinweise]
v0.10.1: 8. Januar 2021 [Versionshinweise]
v0.10.0: 25. November 2020 [Versionshinweise]
v0.9.4: 25. Juni 2020 [Versionshinweise]
v0.9.3: 26. Mai 2020 [Versionshinweise]
v0.9.2: 14. Mai 2020 [Versionshinweise]
v0.9.1: 6. Mai 2020 [Versionshinweise]
v0.9.0: 18. April 2020 [Versionshinweise]
v0.8.1: 22. März 2020 [Versionshinweise]
v0.8.0: 11. März 2020 [Versionshinweise]
v0.7.2: 25. Januar 2020 [Versionshinweise]
v0.7.1: 9. Januar 2020 [Versionshinweise]
v0.7.0: 13. Dezember 2019 [Versionshinweise]
v0.6.0: 6. September 2019 [Versionshinweise] [Bekannte Probleme]
v0.5.1: 11. Juni 2019 [Versionshinweise]
v0.5.0: 5. Juni 2019 [Versionshinweise]
v0.4.0: 4. März 2019 [Versionshinweise]
v0.3.0: 16. Dezember 2018 [Versionshinweise]
v0.2.0: 10. September 2018 [Versionshinweise]
v0.1.0: 4. Juli 2018 [Versionshinweise]

️ Historische Notizen

Anserini wurde beim Commit 272565 (02.08.2022) auf Lucene 9.3 aktualisiert: Dieses Upgrade verursachte Abwärtskompatibilitätsprobleme, siehe #1952. Anserini erkennt Lucene 8-Indizes automatisch und deaktiviert konsistentes Tie-Breaking, um Laufzeitfehler zu vermeiden. Allerdings liefert Lucene 9-Code, der auf Lucene 8-Indizes ausgeführt wird, möglicherweise etwas andere Ergebnisse als Lucene 8-Code, der auf Lucene 8-Indizes ausgeführt wird. Lucene 8-Code kann nicht auf Lucene 9-Indizes ausgeführt werden. Pyserini wurde ebenfalls aktualisiert und es treten ähnliche Probleme auf: Lucene 9-Code, der auf Lucene 8-Indizes ausgeführt wird, liefert möglicherweise etwas andere Ergebnisse als Lucene 8-Code, der auf Lucene 8-Indizes ausgeführt wird.
Anserini wurde am Commit 17b702d (11.07.2019) von Java 8 auf Java 11 aktualisiert. Maven 3.3+ ist ebenfalls erforderlich.
Anserini wurde zum Commit 75e36f9 (12.06.2019) auf Lucene 8.0 aktualisiert; Zuvor verwendet das Toolkit Lucene 7.6. Basierend auf vorläufigen Experimenten wurde die Latenz der Abfrageauswertung in Lucene 8 erheblich verbessert. Als Ergebnis dieses Upgrades haben sich die Ergebnisse aller Regressionen leicht geändert. Um alte Ergebnisse von Lucene 7.6 zu reproduzieren, verwenden Sie v0.5.1.

Referenzen

Jimmy Lin, Matt Crane, Andrew Trotman, Jamie Callan, Ishan Chattopadhyaya, John Foley, Grant Ingersoll, Craig Macdonald, Sebastiano Vigna. Auf dem Weg zu reproduzierbaren Basislinien: Die Herausforderung der Open-Source-IR-Reproduzierbarkeit. ECIR 2016 .
Peilin Yang, Hui Fang und Jimmy Lin. Anserini: Ermöglichung der Verwendung von Lucene für die Informationsabrufforschung. SIGIR 2017 .
Peilin Yang, Hui Fang und Jimmy Lin. Anserini: Reproduzierbare Ranking-Baselines mit Lucene. Journal of Data and Information Quality , 10(4), Artikel 16, 2018.

Danksagungen

Diese Forschung wird teilweise vom Natural Sciences and Engineering Research Council (NSERC) von Kanada unterstützt. Frühere Unterstützung kam von der US National Science Foundation unter IIS-1423002 und CNS-1405688. Alle geäußerten Meinungen, Erkenntnisse und Schlussfolgerungen oder Empfehlungen spiegeln nicht unbedingt die Ansichten der Sponsoren wider.

Expandieren

Zusätzliche Informationen

Version
Typ Anderer Quellcode
Aktualisierungszeit 2024-12-27
Größe 50MB
Kommt von Github

Ähnliche Anwendungen

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15