UniIR Download – Download UniIR Quellcodes

UniIR

AI-Quellcode

1.0.0

Herunterladen

UniIR

Startseite | ? Datensatz (M-BEIR-Benchmark) | ? Kontrollpunkte ( UniIR Modelle) | arXiv | GitHub

Dieses Repo enthält die Codebasis für das ECCV-2024-Papier „ UniIR : Training and Benchmarking Universal Multimodal Information Retrievers“.

?Nachricht

[13.04.2024] : Wir heben eine weitere wertvolle und gleichzeitige Forschung zum Training von multimodalen Retrievern, die Anweisungen befolgen und mehrere Aufgaben ausführen, mit Late-Interaction hervor: PreFLMR: Scaling Up Fine-Grained Late-Interaction Multi-modal Retrievers durchgeführt von den Forschern der Universität Cambridge. Außerdem stellten sie den M2KR-Benchmark vor, mit dem multimodale Universal Information Retriever trainiert und bewertet werden können. Wir können die M2KR- und M-BEIR-Benchmarks kombinieren, um den Fortschritt in diesem Bereich zu erleichtern.
[18.03.2024]: Die großen Prüfpunkte UniIR (CLIP_SF) und UniIR (BLIP_FF) freigeben ? Kontrollpunkte
[21.12.2023]: Unser ? M-BEIR Benchmark ist jetzt zur Nutzung verfügbar.

Einführung

Wir schlagen das UniIR Framework (Universal Multimodal Information Retrieval) vor, um einem einzelnen Retriever beizubringen, (möglicherweise) jede Retrieval-Aufgabe zu erfüllen. Im Gegensatz zu herkömmlichen IR-Systemen muss UniIR den Anweisungen folgen, um eine heterogene Abfrage aus einem heterogenen Kandidatenpool mit Millionen von Kandidaten in verschiedenen Modalitäten abzurufen.

Inhalt

M-BEIR
Ausbildung
Auswertung
Modellzoo
Zitate und Kontakt

M-BEIR

Um universelle multimodale Retrieval-Modelle zu trainieren und zu bewerten, erstellen wir einen groß angelegten Retrieval-Benchmark namens M-BEIR (Multimodal BEnchmark for Instructed Retrieval).

M-BEIR wird heruntergeladen

Wir stellen den M-BEIR-Datensatz im ? Datensatz . Bitte befolgen Sie die Anweisungen auf der HF-Seite, um den Datensatz herunterzuladen und die Daten für das Training und die Auswertung vorzubereiten. Sie müssen GiT LFS einrichten und das Repo direkt klonen:

 git clone https://huggingface.co/datasets/TIGER-Lab/M-BEIR

UniIR Modelle

Wir stellen die Codebasis für das Training und die Evaluierung der UniIR -Modelle CLIP-ScoreFusion, CLIP-FeatureFusion, BLIP-ScoreFusion und BLIP-FeatureFusion bereit.

Umfeld

Bereiten Sie die Codebasis des UniIR -Projekts und der Conda-Umgebung mit den folgenden Befehlen vor:

UniIR cd src/models/ conda env create -f UniIR _env.yml">

git clone https://github.com/TIGER-AI-Lab/UniIR
cd UniIR

cd src/models/
conda env create -f UniIR _env.yml

Ausbildung

Um die UniIR Modelle anhand vorab trainierter CLIP- und BLIP-Kontrollpunkte zu trainieren, befolgen Sie bitte die nachstehenden Anweisungen. Die Skripte laden automatisch die vorab trainierten CLIP- und BLIP-Prüfpunkte herunter.

1. Laden Sie den M-BEIR-Benchmark herunter

Bitte laden Sie den M-BEIR-Benchmark herunter, indem Sie den Anweisungen im Abschnitt M-BEIR folgen.

2. Skripte

So trainieren Sie UniIR CLIP_SF Large mit der Standardkonfiguration:

 cd src/models/ UniIR _clip/clip_scorefusion/configs_scripts/large/train/inbatch/

Ändern Sie inbatch.yaml für die Optimierung von Hyperparametern und run_inbatch.sh für Ihre eigene Umgebung und Pfade.

Notiz:

Ändern Sie das UniIR _DIR in run_inbatch.sh in das Verzeichnis, in dem Sie die Prüfpunkte speichern möchten.
Ändern Sie MBEIR_DATA_DIR in run_inbatch.sh in das Verzeichnis, in dem Sie den M-BEIR-Benchmark speichern.
Ändern Sie das SRC_DIR in run_inbatch.sh in das Verzeichnis, in dem Sie die Codebasis des UniIR -Projekts (dieses Repo) speichern.
Standardmäßig werden UniIR -Modelle auf M-BEIR mit In-Batch-Negativen trainiert und die von den Originaldatensätzen bereitgestellten Hard-Negative werden nicht verwendet.
Wir haben wandb verwendet, um den Trainingsprozess zu protokollieren. Bitte stellen Sie sicher, dass eine .env Umgebung mit WANDB_API_KEY , WANDB_PROJECT und WANDB_ENTITY festgelegt ist.

Anschließend können Sie den folgenden Befehl ausführen, um das UniIR CLIP_SF Large-Modell zu trainieren.

bash run_inbatch.sh

So trainieren Sie UniIR BLIP_FF Large mit der Standardkonfiguration:

 cd src/models/ UniIR _blip/blip_featurefusion/configs_scripts/large/train/inbatch/

Ändern Sie inbatch.yaml für die Optimierung von Hyperparametern und run_inbatch.sh für Ihre eigene Umgebung und Pfade.

bash run_inbatch.sh

Ebenso können Sie die Modelle UniIR CLIP_FF und BLIP_SF trainieren, indem Sie die entsprechenden Skripte ändern.

Auswertung

Wir stellen die Evaluierungspipeline für die UniIR -Modelle auf dem M-BEIR-Benchmark bereit.

1. Umwelt

Bitte erstellen Sie eine Umgebung für die FAISS-Bibliothek:

 # From the root directory of the project
cd src/common/
conda env create -f faiss_env.yml

2. Laden Sie den M-BEIR-Benchmark herunter

Bitte laden Sie den M-BEIR-Benchmark herunter, indem Sie den Anweisungen im Abschnitt M-BEIR folgen.

3. Laden Sie die UniIR Checkpoints herunter

Sie können die UniIR Modelle von Grund auf trainieren oder die vorab trainierten UniIR Kontrollpunkte herunterladen, indem Sie den Anweisungen im Abschnitt „Modell-Zoo“ folgen.

4. Skripte

So evaluieren Sie UniIR CLIP_SF Large mit der Standardkonfiguration:

 cd src/models/ UniIR _clip/clip_scorefusion/configs_scripts/large/eval/inbatch/

Ändern Sie embed.yaml , index.yaml , retrieval.yaml und run_eval_pipeline_inbatch.sh für Ihre eigene Umgebung, Pfade und Auswertungseinstellungen.

Notiz:

Wenn Sie unser vorab trainiertes UniIR -Modell herunterladen, ändern Sie bitte das UniIR _DIR in run_eval_pipeline_inbatch.sh in das Verzeichnis, in dem Sie große Dateien speichern möchten, einschließlich der Prüfpunkte, Einbettungen, Index- und Abrufergebnisse. Anschließend können Sie die Datei clip_sf_large.pth im folgenden Pfad ablegen:
```
 $ UniIR _DIR /checkpoint/CLIP_SF/Large/Instruct/InBatch/clip_sf_large.pth
```
Dies ist der Standardpfad, der durch model.ckpt_config in der Datei embed.yaml angegeben wird.
Ändern Sie MBEIR_DATA_DIR in run_eval_pipeline_inbatch.sh in das Verzeichnis, in dem Sie den M-BEIR-Benchmark speichern.
Ändern Sie das SRC_DIR in run_eval_pipeline_inbatch.sh in das Verzeichnis, in dem Sie die Codebasis des UniIR -Projekts speichern (dieses Repo).

Die Standardkonfiguration bewertet das UniIR CLIP_SF Large-Modell sowohl anhand der Benchmarks M-BEIR (5,6 Mio. heterogener Kandidatenpool) als auch M-BEIR_local (homogener Kandidatenpool). UNION in den Yaml-Dateien bezieht sich auf M-BEIR (5,6 Mio. heterogener Kandidatenpool). Sie können den Kommentaren in den Yaml-Dateien folgen und die Konfigurationen ändern, um das Modell nur im M-BEIR_local-Benchmark zu bewerten.

bash run_eval_pipeline_inbatch.sh

embed , index , logger und retrieval_results werden im Verzeichnis $ UniIR _DIR gespeichert.

So evaluieren Sie UniIR BLIP_FF Large mit der Standardkonfiguration:

 cd src/models/unii_blip/blip_featurefusion/configs_scripts/large/eval/inbatch/

Wenn Sie unser vorab trainiertes UniIR -Modell herunterladen, können Sie die Datei blip_ff_large.pth ebenfalls im folgenden Pfad platzieren:

 $ UniIR _DIR /checkpoint/BLIP_FF/Large/Instruct/InBatch/blip_ff_large.pth

Die Standardkonfiguration bewertet das UniIR BLIP_FF Large-Modell sowohl im M-BEIR- als auch im M-BEIR_local-Benchmark.

bash run_eval_pipeline_inbatch.sh

UniRAG-Bewertung

Die UniRAG-Auswertung ist der Standardauswertung mit den folgenden Unterschieden sehr ähnlich:

Es speichert JSONL-Dateien mit Abfragen und den abgerufenen Kandidaten unter retrieval_results . Dies ist nützlich, wenn die abgerufenen Ergebnisse in nachgelagerten Anwendungen wie RAG verwendet werden.
Wenn retrieve_image_text_pairs in retrieval.yaml auf True gesetzt ist, wird für jeden Kandidaten mit der Nur text oder image -Modalität ein Komplementkandidat abgerufen. Mit dieser Einstellung verfügen der Kandidat und seine Ergänzung immer über image, text . Komplementkandidaten werden abgerufen, indem die ursprünglichen Kandidaten als Abfragen verwendet werden (z. B. _Abfragetext -> _{Kandidatenbild} -> _{Komplementkandidatentext} ).
Um Auswertungen im UniRAG-Modus auszuführen, befolgen Sie die oben angegebenen Anweisungen und ersetzen Sie InBatch und inbatch durch UniRAG bzw. unirag .

Sie können die Modelle UniIR CLIP_FF und BLIP_SF trainieren und auswerten, indem Sie die entsprechenden Skripte ändern.

Modellzoo

Wir stellen die Checkpoints UniIR Modells im ? Kontrollpunkte . Sie können die Prüfpunkte direkt für Abrufaufgaben verwenden oder die Modelle für Ihre eigenen Abrufaufgaben optimieren.

Verfügbare Kontrollpunkte

Modellname	Version	Modellgröße	Modelllink
UniIR (CLIP-SF)	Groß	5,13 GB	Download-Link
UniIR (BLIP-FF)	Groß	7,49 GB	Download-Link

Sie können sie hier herunterladen

 git clone https://huggingface.co/TIGER-Lab/UniIR

Zitat und Kontakt

Cong Wei: [email protected]
Yang Chen: [email protected]
Alan Ritter: [email protected]
Wenhu Chen: [email protected]

BibTeX:

UniIR, title={ UniIR : Training and benchmarking universal multimodal information retrievers}, author={Wei, Cong and Chen, Yang and Chen, Haonan and Hu, Hexiang and Zhang, Ge and Fu, Jie and Ritter, Alan and Chen, Wenhu}, journal={arXiv preprint arXiv:2311.17136}, year={2023} }">

 @article { wei2023 UniIR ,
  title = { UniIR : Training and benchmarking universal multimodal information retrievers } ,
  author = { Wei, Cong and Chen, Yang and Chen, Haonan and Hu, Hexiang and Zhang, Ge and Fu, Jie and Ritter, Alan and Chen, Wenhu } ,
  journal = { arXiv preprint arXiv:2311.17136 } ,
  year = { 2023 }
}

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ AI-Quellcode
Aktualisierungszeit 2024-12-30
Größe 50MB
Kommt von Github

Ähnliche Anwendungen

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14