ดาวน์โหลด Link Context Learning - Link Context Learning ซอร์สโค้ดการดาวน์โหลด

Link Context Learning

ซอร์สโค้ดอื่น ๆ

ดาวน์โหลด

Link-Context Learning สำหรับ LLM หลายรูปแบบ [CVPR 2024]

Yan Tai ^{*, 2,3,4} Weichen Fan ^{*, †, 3} Zhao Zhang ³ Ziwei Liu ^{✉, 1}

¹ S-LAB, Nanyang Technological University ² Shanghai Jiao Tong University ³ การวิจัย Sensetime
⁴ สถาบัน Ningbo Institute of Digital Twin, Eastern Institute of Technology, Ningbo, China

^* การมีส่วนร่วมที่เท่าเทียม ^† ผู้นำโครงการ ^✉ ผู้เขียนที่เกี่ยวข้อง

การใช้งาน Pytorch อย่างเป็นทางการของ "การเรียนรู้บริบทลิงก์สำหรับ LLMs หลายรูปแบบ" [CVPR 2024]

การอัปเดต

28 ก.พ. 2024 ?? บทความของเราได้รับการยอมรับจาก CVPR 2024! -
05 ก.ย. , 2023 : เราปล่อยรหัสข้อมูลและจุดตรวจสอบ LCL-2way-weight
24 ส.ค. 2023 : เราปล่อยตัวอย่างออนไลน์ที่? lcl-demo?
17 ส.ค. , 2023 : เราปล่อยสองชุดย่อยของ isekai (isekai-10 และ isekai-pair) ที่ [Hugging Face?]

ที่เก็บนี้มี การใช้งานอย่างเป็นทางการ และ ชุดข้อมูล ของกระดาษต่อไปนี้:

การเรียนรู้ลิงค์บริบทสำหรับ LLMs หลายรูปแบบ
https://arxiv.org/abs/2308.07891
บทคัดย่อ: ความสามารถในการเรียนรู้จากบริบทที่มีแนวคิดใหม่และให้คำตอบที่เหมาะสมเป็นสิ่งจำเป็นในการสนทนาของมนุษย์ แม้จะมีโมเดลภาษาขนาดใหญ่หลายรูปแบบ (MLLMs) และโมเดลภาษาขนาดใหญ่ (LLMS) ได้รับการฝึกฝนในชุดข้อมูลขนาดใหญ่การตระหนักถึงภาพที่มองไม่เห็นหรือทำความเข้าใจแนวคิดใหม่ในลักษณะที่ปราศจากการฝึกอบรมยังคงเป็นสิ่งที่ท้าทาย การเรียนรู้ในบริบท (ICL) สำรวจการเรียนรู้ไม่กี่การฝึกอบรมที่ซึ่งแบบจำลองได้รับการสนับสนุนให้ "เรียนรู้ที่จะเรียนรู้" จากงานที่ จำกัด และสรุปให้กับงานที่มองไม่เห็น ในงานนี้เราเสนอการเรียนรู้บริบทลิงก์ (LCL) ซึ่งเน้น "การใช้เหตุผลจากสาเหตุและผลกระทบ" เพื่อเพิ่มความสามารถในการเรียนรู้ของ MLLMS LCL เกินกว่า ICL แบบดั้งเดิมโดยเสริมสร้างความสัมพันธ์เชิงสาเหตุระหว่างชุดสนับสนุนและชุดคิวรีอย่างชัดเจน ด้วยการให้การสาธิตด้วยการเชื่อมโยงเชิงสาเหตุ LCL นำเสนอแบบจำลองเพื่อแยกแยะไม่เพียง แต่การเปรียบเทียบ แต่ยังรวมถึงความสัมพันธ์เชิงสาเหตุพื้นฐานระหว่างจุดข้อมูลซึ่งช่วยให้ Mllms รับรู้ภาพที่มองไม่เห็นและเข้าใจแนวคิดใหม่ได้อย่างมีประสิทธิภาพมากขึ้น เพื่ออำนวยความสะดวกในการประเมินวิธีการใหม่นี้เราแนะนำชุดข้อมูล ISEKAI ซึ่งประกอบด้วยคู่ที่สร้างภาพฉลากภาพที่ไม่ได้รับการออกแบบมาสำหรับการเรียนรู้ลิงก์เชื่อมโยง การทดลองอย่างกว้างขวางแสดงให้เห็นว่า LCL-MLLM ของเราแสดงความสามารถในการเรียนรู้บริบทลิงก์ที่แข็งแกร่งสำหรับแนวคิดใหม่ ๆ เกี่ยวกับวานิลลา Mllms

สิ่งที่ต้องทำ

ปล่อย Isekai-10 และ Isekai-Pair
ปล่อยการใช้ชุดข้อมูล
ปล่อยตัวอย่าง
ปล่อยรหัสและจุดตรวจ
เปิดตัวชุดข้อมูล isekai แบบเต็ม
จุดตรวจสอบที่รองรับการตรวจจับไม่กี่นัดและงาน VQA

เริ่มต้น

ติดตั้ง
ด่าน
ชุดข้อมูล
การสาธิต

ติดตั้ง

conda create -n lcl python=3.10
conda activate lcl
pip install -r requirements.txt

กำหนดค่าเร่งความเร็ว

accelerate config

ชุดข้อมูล

ImageNet

เราฝึกการตั้งค่า LCL ในชุด imagenet-900 ของเราใหม่และประเมินโมเดลในชุด Imagenet-100 คุณสามารถรับชุดข้อมูล JSON ได้ที่นี่

isekai

เราประเมินโมเดลบน ISEKAI-10 และ ISEKAI-PAIR คุณสามารถดาวน์โหลดชุดข้อมูล ISEKAI ใน ISEKAI-10 และ ISEKAI-PAIR

ด่าน

ดาวน์โหลดจุดตรวจสอบ LCL-2way-weight และ LCL-mix ของเราใน HuggingFace

การสาธิต

ในการเปิดการสาธิตเว็บ Gradio ให้ใช้คำสั่งต่อไปนี้ โปรดทราบว่ารูปแบบการประเมินในรูปแบบ Torch.Float16 ซึ่งต้องใช้ GPU ที่มีหน่วยความจำอย่างน้อย 16GB

python ./mllm/demo/demo.py --model_path /path/to/lcl/ckpt

นอกจากนี้ยังเป็นไปได้ที่จะใช้ในการหาปริมาณ 8 บิตแม้ว่าจะมีค่าใช้จ่ายในการเสียสละประสิทธิภาพบางอย่าง

python ./mllm/demo/demo.py --model_path /path/to/lcl/ckpt --load_in_8bit

รถไฟ

หลังจากเตรียมข้อมูลคุณสามารถฝึกอบรมแบบจำลองโดยใช้คำสั่ง:

LCL-2way-weight

accelerate launch --num_processes 4 
        --main_process_port 23786 
        mllm/pipeline/finetune.py 
        config/lcl_train_2way_weight.py 
        --cfg-options data_args.use_icl=True 
        --cfg-options model_args.model_name_or_path=/path/to/init/checkpoint

lcl-2way-mix

accelerate launch --num_processes 4 
        --main_process_port 23786 
        mllm/pipeline/finetune.py 
        config/lcl_train_mix1.py 
        --cfg-options data_args.use_icl=True 
        --cfg-options model_args.model_name_or_path=/path/to/init/checkpoint

การอนุมาน

หลังจากเตรียมข้อมูลคุณสามารถอนุมานแบบจำลองโดยใช้คำสั่ง:

ImageNet-100

accelerate launch --num_processes 4 
        --main_process_port 23786 
        mllm/pipeline/finetune.py 
        config/lcl_eval_ISEKAI_10.py 
        --cfg-options data_args.use_icl=True 
        --cfg-options model_args.model_name_or_path=/path/to/checkpoint

Mmengine Style Args และ HuggingFace: รองรับ Trainer Args ตัวอย่างเช่นคุณสามารถเปลี่ยน eval batchsize เช่นนี้:

isekai

 # ISEKAI10
accelerate launch --num_processes 4 
        --main_process_port 23786 
        mllm/pipeline/finetune.py 
        config/shikra_eval_multi_pope.py 
        --cfg-options data_args.use_icl=True 
        --cfg-options model_args.model_name_or_path=/path/to/checkpoint 
        --per_device_eval_batch_size 1

# ISEKAI-PAIR
accelerate launch --num_processes 4 
        --main_process_port 23786 
        mllm/pipeline/finetune.py 
        config/shikra_eval_multi_pope.py 
        --cfg-options data_args.use_icl=True 
        --cfg-options model_args.model_name_or_path=/path/to/checkpoint 
        --per_device_eval_batch_size 1

โดยที่ --cfg-options a=balabala b=balabala เป็นอาร์กิวเมนต์สไตล์ mmengine พวกเขาจะเขียนทับอาร์กิวเมนต์ที่กำหนดไว้ล่วงหน้าในไฟล์กำหนดค่า และ --per_device_eval_batch_size คือ HuggingFace: Trainer Argument

ผลการทำนายจะถูกบันทึกไว้ใน output_dir/multitest_xxxx_extra_prediction.jsonl ซึ่งมีลำดับเดียวกับชุดข้อมูลอินพุต

อ้างถึง

 @inproceedings { tai2023link ,
  title = { Link-Context Learning for Multimodal LLMs } ,
  author = { Tai, Yan and Fan, Weichen and Zhang, Zhao and Liu, Ziwei } ,
  booktitle = { Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (CVPR) } ,
  year = { 2024 }
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-08
ขนาด 32.18MB
มาจาก Github

แอปที่เกี่ยวข้อง

Parameter Efficient Transfer Learning Benchmark

2024-11-06
ลิงค์เกมศิลปะ

2024-02-21
เกมส์ระเบิดลิงค์บอล

2023-08-13
ลิงค์ไอน้ำ

2023-04-23
แอพลิงค์ bilibili

2023-04-14
เครื่องมือตรวจสอบลิงค์เว็บ

2009-04-16

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
MySchedule.py

ซอร์สโค้ดอื่น ๆ

Updates to the fetching of week codes
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด