ดาวน์โหลด UniIR - ดาวน์โหลดซอร์สโค้ด UniIR

UniIR

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

UniIR

หน้าแรก | - ชุดข้อมูล(เกณฑ์มาตรฐาน M-BEIR) | - จุดตรวจ (รุ่น UniIR ) | arXiv | GitHub

การซื้อคืนนี้มีฐานรหัสสำหรับรายงาน ECCV-2024 " UniIR : Training and Benchmarking Universal Multimodal Information Retrievers"

?ข่าว

[13-04-2567] : เราเน้นย้ำงานวิจัยที่มีคุณค่าและเกิดขึ้นพร้อมกันอีกประการหนึ่งเกี่ยวกับการฝึกอบรมเครื่องดึงข้อมูลหลายรูปแบบตามคำแนะนำและทำงานหลายงานด้วยการโต้ตอบล่าช้า:PreFLMR: Scaling Up Fine-Grained Late-Interaction Multi-modal Retrievers ซึ่ง ทำโดยนักวิจัยจากมหาวิทยาลัยเคมบริดจ์ พวกเขายังแนะนำเกณฑ์มาตรฐาน M2KR ซึ่งสามารถใช้ในการฝึกอบรมและประเมินผู้ดึงข้อมูลสากลหลายรูปแบบ เราอาจรวมการวัดประสิทธิภาพ M2KR และ M-BEIR เข้าด้วยกันเพื่ออำนวยความสะดวกในการพัฒนาด้านนี้
[18-03-2567]: ปล่อยจุดตรวจขนาดใหญ่ UniIR (CLIP_SF) และ UniIR (BLIP_FF) ขนาดใหญ่ ? จุดตรวจ
[21-12-2566]: ของเรา ? เกณฑ์มาตรฐาน M-BEIR พร้อมใช้งานแล้ว

การแนะนำ

เราเสนอ เฟรมเวิร์ก UniIR (การดึงข้อมูลหลายรูปแบบสากล) เพื่อเรียนรู้ผู้ดึงข้อมูลเพียงตัวเดียวเพื่อบรรลุ (อาจ) งานการดึงข้อมูลใด ๆ แตกต่างจากระบบ IR แบบดั้งเดิม UniIR จำเป็นต้องปฏิบัติตามคำแนะนำในการสืบค้นที่แตกต่างกันเพื่อดึงข้อมูลจากกลุ่มผู้สมัครที่ต่างกันซึ่งมีผู้สมัครหลายล้านคนในรูปแบบที่หลากหลาย

<ช่วงคลาส= ทีเซอร์ UniIR" style="width: 80%; ความกว้างสูงสุด: 100%;">

เนื้อหา

เอ็ม-เบียร์
การฝึกอบรม
การประเมิน
สวนสัตว์จำลอง
การอ้างอิงและการติดต่อ

เอ็ม-เบียร์

เพื่อฝึกอบรมและประเมินโมเดลการดึงข้อมูลหลายรูปแบบสากล เราได้สร้างเกณฑ์มาตรฐานการดึงข้อมูลขนาดใหญ่ชื่อ M-BEIR (BEnchmark หลายรูปแบบสำหรับการดึงข้อมูลแบบมีคำสั่ง)

กำลังดาวน์โหลด M-BEIR

เราจัดเตรียมชุดข้อมูล M-BEIR ไว้ใน ? ชุดข้อมูล โปรดปฏิบัติตามคำแนะนำที่ให้ไว้ในหน้า HF เพื่อดาวน์โหลดชุดข้อมูลและเตรียมข้อมูลสำหรับการฝึกอบรมและการประเมินผล คุณต้องตั้งค่า GiT LFS และโคลน repo โดยตรง:

 git clone https://huggingface.co/datasets/TIGER-Lab/M-BEIR

โมเดล UniIR

เราจัดเตรียมโค้ดเบสสำหรับการฝึกอบรมและประเมินโมเดล UniIR CLIP-ScoreFusion, CLIP-FeatureFusion, BLIP-ScoreFusion และ BLIP-FeatureFusion

สิ่งแวดล้อม

เตรียมโค้ดเบสของโปรเจ็กต์ UniIR และสภาพแวดล้อม Conda โดยใช้คำสั่งต่อไปนี้:

UniIR cd src/models/ conda env create -f UniIR _env.yml">

git clone https://github.com/TIGER-AI-Lab/UniIR
cd UniIR

cd src/models/
conda env create -f UniIR _env.yml

การฝึกอบรม

หากต้องการฝึกโมเดล UniIR จากจุดตรวจ CLIP และ BLIP ที่ผ่านการฝึกอบรมแล้ว โปรดปฏิบัติตามคำแนะนำด้านล่าง สคริปต์จะดาวน์โหลดจุดตรวจ CLIP และ BLIP ที่ได้รับการฝึกไว้ล่วงหน้าโดยอัตโนมัติ

1. ดาวน์โหลดเกณฑ์มาตรฐาน M-BEIR

โปรดดาวน์โหลดเกณฑ์มาตรฐาน M-BEIR โดยทำตามคำแนะนำในส่วน M-BEIR

2. สคริปต์

วิธีฝึก UniIR CLIP_SF Large ด้วยการกำหนดค่าเริ่มต้น:

 cd src/models/ UniIR _clip/clip_scorefusion/configs_scripts/large/train/inbatch/

แก้ไข inbatch.yaml สำหรับการปรับแต่งไฮเปอร์พารามิเตอร์ และ run_inbatch.sh สำหรับสภาพแวดล้อมและเส้นทางของคุณเอง

บันทึก:

แก้ไข UniIR _DIR ใน run_inbatch.sh ไปยังไดเร็กทอรีที่คุณต้องการจัดเก็บจุดตรวจสอบ
แก้ไข MBEIR_DATA_DIR ใน run_inbatch.sh ไปยังไดเร็กทอรีที่คุณจัดเก็บการวัดประสิทธิภาพ M-BEIR
แก้ไข SRC_DIR ใน run_inbatch.sh ไปยังไดเร็กทอรีที่คุณจัดเก็บ codebase ของโปรเจ็กต์ UniIR (repo นี้)
ตามค่าเริ่มต้น โมเดล UniIR จะได้รับการฝึกบน M-BEIR ด้วยค่าเนกาทีฟในแบตช์ และค่าเนกาทีฟแบบฮาร์ดที่ได้รับจากชุดข้อมูลดั้งเดิมจะไม่ถูกนำมาใช้
เราใช้ไม้กายสิทธิ์เพื่อบันทึกกระบวนการฝึกอบรม โปรดตรวจสอบให้แน่ใจว่าได้ตั้งค่าสภาพแวดล้อม . .env ด้วย WANDB_API_KEY , WANDB_PROJECT และ WANDB_ENTITY แล้ว

จากนั้นคุณสามารถรันคำสั่งต่อไปนี้เพื่อฝึก UniIR CLIP_SF โมเดลขนาดใหญ่

bash run_inbatch.sh

วิธีฝึก UniIR BLIP_FF Large ด้วยการกำหนดค่าเริ่มต้น:

 cd src/models/ UniIR _blip/blip_featurefusion/configs_scripts/large/train/inbatch/

แก้ไข inbatch.yaml สำหรับการปรับแต่งไฮเปอร์พารามิเตอร์ และ run_inbatch.sh สำหรับสภาพแวดล้อมและเส้นทางของคุณเอง

bash run_inbatch.sh

ในทำนองเดียวกัน คุณสามารถฝึกโมเดล UniIR CLIP_FF และ BLIP_SF ได้โดยการแก้ไขสคริปต์ที่เกี่ยวข้อง

การประเมิน

เราจัดเตรียมขั้นตอนการประเมินสำหรับโมเดล UniIR บนเกณฑ์มาตรฐาน M-BEIR

1. สิ่งแวดล้อม

โปรดสร้างสภาพแวดล้อมสำหรับห้องสมุด FAISS:

 # From the root directory of the project
cd src/common/
conda env create -f faiss_env.yml

2. ดาวน์โหลดเกณฑ์มาตรฐาน M-BEIR

โปรดดาวน์โหลดเกณฑ์มาตรฐาน M-BEIR โดยทำตามคำแนะนำในส่วน M-BEIR

3. ดาวน์โหลดจุดตรวจ UniIR

คุณสามารถฝึกโมเดล UniIR ได้ตั้งแต่เริ่มต้น หรือดาวน์โหลดจุดตรวจ UniIR ที่ได้รับการฝึกมาแล้วโดยทำตามคำแนะนำในส่วน Model Zoo

4. สคริปต์

ในการประเมิน UniIR CLIP_SF Large ด้วยการกำหนดค่าเริ่มต้น:

 cd src/models/ UniIR _clip/clip_scorefusion/configs_scripts/large/eval/inbatch/

แก้ไข embed.yaml , index.yaml , retrieval.yaml และ run_eval_pipeline_inbatch.sh สำหรับสภาพแวดล้อม เส้นทาง และการตั้งค่าการประเมินผลของคุณเอง

บันทึก:

หากคุณดาวน์โหลดโมเดล UniIR ที่ได้รับการฝึกล่วงหน้าของเรา โปรดแก้ไข UniIR _DIR ใน run_eval_pipeline_inbatch.sh ไปยังไดเร็กทอรีที่คุณต้องการจัดเก็บไฟล์ขนาดใหญ่ รวมถึงจุดตรวจสอบ การฝัง ดัชนี และผลลัพธ์การดึงข้อมูล จากนั้นคุณสามารถวางไฟล์ clip_sf_large.pth ในพาธต่อไปนี้:
```
 $ UniIR _DIR /checkpoint/CLIP_SF/Large/Instruct/InBatch/clip_sf_large.pth
```
นี่เป็นเส้นทางเริ่มต้นที่ระบุโดย model.ckpt_config ในไฟล์ embed.yaml
แก้ไข MBEIR_DATA_DIR ใน run_eval_pipeline_inbatch.sh ไปยังไดเร็กทอรีที่คุณจัดเก็บการวัดประสิทธิภาพ M-BEIR
แก้ไข SRC_DIR ใน run_eval_pipeline_inbatch.sh ไปยังไดเร็กทอรีที่คุณจัดเก็บ codebase ของโปรเจ็กต์ UniIR (repo นี้)

การกำหนดค่าเริ่มต้นจะประเมินโมเดลขนาดใหญ่ UniIR CLIP_SF บนทั้งการวัดประสิทธิภาพ M-BEIR (กลุ่มผู้สมัครที่แตกต่างกัน 5.6M) และเกณฑ์มาตรฐาน M-BEIR_local (กลุ่มผู้สมัครที่เป็นเนื้อเดียวกัน) UNION ในไฟล์ yaml อ้างถึง M-BEIR (กลุ่มผู้สมัครที่แตกต่างกัน 5.6M) คุณสามารถติดตามความคิดเห็นในไฟล์ yaml และแก้ไขการกำหนดค่าเพื่อประเมินโมเดลบนเกณฑ์มาตรฐาน M-BEIR_local เท่านั้น

bash run_eval_pipeline_inbatch.sh

embed , index , logger และ retrieval_results จะถูกบันทึกไว้ในไดเร็กทอรี $ UniIR _DIR

ในการประเมิน UniIR BLIP_FF Large ด้วยการกำหนดค่าเริ่มต้น:

 cd src/models/unii_blip/blip_featurefusion/configs_scripts/large/eval/inbatch/

ในทำนองเดียวกัน หากคุณดาวน์โหลดโมเดล UniIR ที่ผ่านการฝึกอบรมแล้ว คุณสามารถวางไฟล์ blip_ff_large.pth ในพาธต่อไปนี้:

 $ UniIR _DIR /checkpoint/BLIP_FF/Large/Instruct/InBatch/blip_ff_large.pth

การกำหนดค่าเริ่มต้นจะประเมินโมเดลขนาดใหญ่ UniIR BLIP_FF บนการวัดประสิทธิภาพทั้ง M-BEIR และ M-BEIR_local

bash run_eval_pipeline_inbatch.sh

การประเมิน UniRAG

การประเมิน UniRAG นั้นคล้ายคลึงกับการประเมินเริ่มต้นมาก โดยมีข้อแตกต่างดังต่อไปนี้:

มันเก็บไฟล์ jsonl ที่มีคำถามและผู้สมัครที่ดึงข้อมูลไว้ภายใต้ retrieval_results สิ่งนี้มีประโยชน์เมื่อผลลัพธ์ที่ดึงมาจะถูกใช้ในแอปพลิเคชันดาวน์สตรีม เช่น RAG
เมื่อตั้ง retrieve_image_text_pairs ใน retrieval.yaml yaml เป็น True ระบบจะดึงตัวเลือกเสริมสำหรับตัวเลือกแต่ละรายการที่มี text หรือ image เท่านั้น ด้วยการตั้งค่านี้ ตัวเลือกและส่วนเสริมจะมี image, text เสมอ ผู้สมัครเสริมจะถูกดึงมาโดยใช้ผู้สมัครดั้งเดิมเป็นแบบสอบถาม (เช่น _{ข้อความ} ค้นหา -> _{รูปภาพ} ผู้สมัคร -> _{ข้อความ} ผู้สมัครเสริม )
หากต้องการรันการประเมินในโหมด UniRAG ให้ทำตามคำแนะนำด้านบนโดยแทนที่ InBatch และ inbatch ด้วย UniRAG และ unirag ตามลำดับ

คุณสามารถฝึกอบรมและประเมินโมเดล UniIR CLIP_FF และ BLIP_SF ได้โดยการแก้ไขสคริปต์ที่เกี่ยวข้อง

สวนสัตว์จำลอง

เราจัดให้มีจุดตรวจสอบโมเดล UniIR ในรูปแบบ ? จุดตรวจ คุณสามารถใช้จุดตรวจสอบสำหรับงานการดึงข้อมูลได้โดยตรง หรือปรับแต่งแบบจำลองสำหรับงานการดึงข้อมูลของคุณเอง

จุดตรวจที่มีอยู่

ชื่อรุ่น	เวอร์ชัน	ขนาดรุ่น	ลิงค์รุ่น
UniIR (คลิป-SF)	ใหญ่	5.13GB	ลิงค์ดาวน์โหลด
UniIR (BLIP-FF)	ใหญ่	7.49GB	ลิงค์ดาวน์โหลด

คุณสามารถดาวน์โหลดได้โดย

 git clone https://huggingface.co/TIGER-Lab/UniIR

การอ้างอิงและการติดต่อ

กงเหว่ย: [email protected]
หยาง เฉิน: [email protected]
อลัน ริตเตอร์: [email protected]
เหวินหู เฉิน: [email protected]

บิบเท็กซ์:

UniIR, title={ UniIR : Training and benchmarking universal multimodal information retrievers}, author={Wei, Cong and Chen, Yang and Chen, Haonan and Hu, Hexiang and Zhang, Ge and Fu, Jie and Ritter, Alan and Chen, Wenhu}, journal={arXiv preprint arXiv:2311.17136}, year={2023} }">

 @article { wei2023 UniIR ,
  title = { UniIR : Training and benchmarking universal multimodal information retrievers } ,
  author = { Wei, Cong and Chen, Yang and Chen, Haonan and Hu, Hexiang and Zhang, Ge and Fu, Jie and Ritter, Alan and Chen, Wenhu } ,
  journal = { arXiv preprint arXiv:2311.17136 } ,
  year = { 2023 }
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2024-12-30
ขนาด 50MB
มาจาก Github

แอปที่เกี่ยวข้อง

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
node telegram bot api

โค้ดแหล่งที่มา AI

v0.50.0
typebot.io

โค้ดแหล่งที่มา AI

v3.1.2
python wechaty getting started

โค้ดแหล่งที่มา AI

1.0.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด