ดาวน์โหลด FollowIR - ดาวน์โหลดซอร์สโค้ด FollowIR

FollowIR

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

FollowIR: การประเมินและการสอนแบบจำลองการดึงข้อมูลเพื่อปฏิบัติตามคำแนะนำ

พื้นที่เก็บข้อมูลอย่างเป็นทางการสำหรับรายงาน FollowIR: การประเมินและการสอนแบบจำลองการดึงข้อมูลเพื่อปฏิบัติตามคำแนะนำ การประเมินอย่างเป็นทางการสามารถทำได้โดยการติดตั้งไลบรารี mteb และประเมินโมเดลที่เข้ากันได้กับ MTEB ของคุณโดยมีการเปลี่ยนแปลงโค้ดเป็นศูนย์ (หรือเพียงไม่กี่บรรทัด)

ลิงค์

ไบนารี่	คำอธิบาย
ติดตามIR-7B	โมเดลพารามิเตอร์ 7B ที่ทำการจัดอันดับเอกสารใหม่ตามแบบสอบถามและคำแนะนำ ได้รับการปรับแต่งอย่างละเอียดจาก Mistral-7B บนชุดข้อมูลด้านล่าง
ติดตาม IR-รถไฟ	ชุดข้อมูลที่ใช้ในการฝึก FollowIR-7B ประกอบด้วยคำสั่งและคำถามของ TREC และ GPT สร้างเอกสารสังเคราะห์ที่ถูกกรองแล้ว
FollowIR-รถไฟดิบ	รถไฟเวอร์ชันกรองล่วงหน้าที่ตั้งไว้ข้างต้น สิ่งนี้ไม่ได้ใช้ในการฝึกโมเดลเนื่องจากข้อมูลที่สร้างโดย GPT บางส่วนไม่ถูกต้อง

คุณยังสามารถค้นหาข้อมูลการทดสอบที่มีคำอธิบายประกอบแต่ละรายการได้ (Robust04, Core17 และ News21) แม้ว่ารูปแบบนี้จะใช้ดีที่สุดกับโค้ดประเมินผลของ MTEB

การติดตั้ง

หากคุณต้องการทำซ้ำการทดลองในรายงาน คุณสามารถใช้โค้ดต่อไปนี้:

git clone https://github.com/orionw/FollowIR.git
cd FollowIR/
conda create -n followir python=3.9 -y
conda activate followir
pip install -r requirements.txt
bash launch_all_jobs.sh

การใช้งาน

หากโมเดลของคุณเข้ากันได้กับ SentenceTransformer และไม่ต้องใช้โทเค็นพิเศษในการเชื่อมโยงการสืบค้นและคำแนะนำ คุณสามารถใช้คำสั่งบรรทัดเดียวต่อไปนี้:

mteb -m $MODEL_NAME -t $DATASET

สำหรับแต่ละชุดข้อมูลใน {Robust04InstructionRetrieval, Core17InstructionRetrieval, News21InstructionRetrieval}

หากคุณมีโมเดลตัวเข้ารหัสคู่ แต่ต้องการทำสิ่งที่แตกต่างจากการเติมคำสั่งต่อท้ายแบบสอบถามด้วยการเว้นวรรค คุณสามารถขยาย DenseRetrievalExactSearch และตรวจสอบ instructions ใน kwargs ได้ ดู (ดู models/base_sentence_transformers/ เป็นจุดเริ่มต้นสำหรับการแก้ไขเล็กน้อย และ models/e5/ สำหรับตัวอย่างที่มีการแก้ไขที่ใหญ่กว่า)

การใช้การจัดอันดับใหม่

เพิ่มผู้จัดอันดับใหม่ใน MTEB แล้ว! หากคุณกำลังใช้โมเดลการจัดอันดับใหม่ คุณจะต้องขยายคลาส DenseRetrievalExactSearch และกำหนด __init__ และฟังก์ชัน predict (ดูส่วนโมเดล/การจัดอันดับใหม่ สำหรับตัวอย่างต่างๆ ของการจัดอันดับใหม่) ฟังก์ชันทำนายของคุณควรอยู่ใน input_to_rerank ซึ่งจะเป็นสิ่งอันดับของแบบฟอร์ม:

 # if there are no instructions, instructions will be a list of Nones
# Instructions will be present for all of the FollowIR datasets
queries , passages , instructions = list ( zip ( * input_to_rerank ))

ฟังก์ชัน predict ของคุณควรใช้สิ่งเหล่านี้และส่งคืนรายการที่มีคะแนนสำหรับแต่ละรายการทูเพิล

การอ้างอิง

หากคุณพบว่าโค้ด ข้อมูล หรือโมเดลมีประโยชน์ คุณสามารถอ้างอิงได้ฟรี:

 @misc { weller2024followir ,
      title = { FollowIR: Evaluating and Teaching Information Retrieval Models to Follow Instructions } , 
      author = { Orion Weller and Benjamin Chang and Sean MacAvaney and Kyle Lo and Arman Cohan and Benjamin Van Durme and Dawn Lawrie and Luca Soldaini } ,
      year = { 2024 } ,
      eprint = { 2403.15246 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { cs.IR }
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2024-12-26
ขนาด 83.12MB
มาจาก Github

แอปที่เกี่ยวข้อง

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
SmartTube

ซอร์สโค้ดอื่น ๆ

24.71 Stable
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด