Link Context Learning下載 - Link Context Learning源代碼下載

Link Context Learning

其他源碼

下載

多模式LLMS的鏈接封閉式學習[CVPR 2024]

Yan Tai ^*，2,3,4 Weichen Fan ^*，†，3 Zhao Zhang ³ Ziwei ^liu✉，1

¹ S-LAB ^，南南技術大學²上海
⁴中國寧波東部技術學院數字雙胞胎研究所

^*平等貢獻^†項目負責人^✉通訊作者

官方的Pytorch實施“多模式LLMS的鏈接封閉式學習” [CVPR 2024]。

更新

2024年2月28日??我們的論文已被CVPR 2024接受！？
05年9月5日，2023年：我們發布代碼，數據和LCL-2Way權重檢查點。
2023年8月24日：我們在“ lcl-demo？”上發佈在線演示。
2023年8月17日：我們在[擁抱的臉嗎？]釋放Isekai（Isekai-10和Isekai Pair）的兩個子集。

該存儲庫包含以下論文的官方實施和數據集：

多模式LLMS的鏈接封閉式學習
https://arxiv.org/abs/2308.07891
摘要：通過新穎概念從上下文中學習並提供適當反應的能力在人類對話中至關重要。儘管當前的多模式大型語言模型（MLLM）和大型語言模型（LLMS）在大型數據集中訓練，但以無訓練的方式識別看不見的圖像或理解新穎概念仍然是一個挑戰。內部文化學習（ICL）探索了無培訓的幾次學習，鼓勵模型從有限任務中“學習”並推廣到看不見的任務。在這項工作中，我們提出了Link-Context學習（LCL），該學習強調了“從因果關係和效果的推理”來增強MLLM的學習能力。通過明確加強支持集與查詢集之間的因果關係，LCL超越了傳統ICL。通過提供因果關係的演示，LCL引導該模型不僅可以辨別類比，而且還可以識別數據點之間的基本因果關係，這使MLLM賦予了MLLM的能力，可以更有效地識別看不見的圖像並更有效地理解新穎的概念。為了促進對這種新穎方法的評估，我們介紹了ISEKAI數據集，該數據集由專為鏈接封閉式學習而設計的未見生成的圖像標籤對組成。廣泛的實驗表明，我們的LCL-MLLM對香草MLLM的新穎概念具有強大的鏈接性學習能力。

托多

發布Isekai-10和Isekai Pair。
發布數據集用法。
發布演示。
釋放代碼和檢查點。
發布完整的ISEKAI數據集。
釋放支持幾個檢測和VQA任務的檢查點。

開始

安裝
檢查點
數據集
演示

安裝

conda create -n lcl python=3.10
conda activate lcl
pip install -r requirements.txt

配置加速

accelerate config

數據集

成像網

我們在Rebuild Imagenet-900套件上訓練LCL設置，並在Imagenet-100套件上評估模型。您可以在此處獲取數據集JSON。

Isekai

我們評估Isekai-10和Isekai Pair上的模型，您可以在Isekai-10和Isekai Pair下載Isekai數據集。

檢查點

在Huggingface中下載我們的LCL-2Way重量和LCL-MIX檢查點。

演示

要啟動Gradio Web演示，請使用以下命令。請注意，該模型在Torch.float16格式中進行評估，該格式需要具有至少16GB內存的GPU。

python ./mllm/demo/demo.py --model_path /path/to/lcl/ckpt

儘管以犧牲某些績效為代價，但也可以將其用於8位量化。

python ./mllm/demo/demo.py --model_path /path/to/lcl/ckpt --load_in_8bit

火車

準備數據後，您可以使用命令訓練模型：

LCL-2Way重量

accelerate launch --num_processes 4 
        --main_process_port 23786 
        mllm/pipeline/finetune.py 
        config/lcl_train_2way_weight.py 
        --cfg-options data_args.use_icl=True 
        --cfg-options model_args.model_name_or_path=/path/to/init/checkpoint

LCL-2Way-Mix

accelerate launch --num_processes 4 
        --main_process_port 23786 
        mllm/pipeline/finetune.py 
        config/lcl_train_mix1.py 
        --cfg-options data_args.use_icl=True 
        --cfg-options model_args.model_name_or_path=/path/to/init/checkpoint

推理

準備數據後，您可以使用命令推導模型：

Imagenet-100

accelerate launch --num_processes 4 
        --main_process_port 23786 
        mllm/pipeline/finetune.py 
        config/lcl_eval_ISEKAI_10.py 
        --cfg-options data_args.use_icl=True 
        --cfg-options model_args.model_name_or_path=/path/to/checkpoint

Mmengine風格的Args和HuggingFace：培訓師ARGS得到了支持。例如，您可以像這樣更改評估批處理：

Isekai

 # ISEKAI10
accelerate launch --num_processes 4 
        --main_process_port 23786 
        mllm/pipeline/finetune.py 
        config/shikra_eval_multi_pope.py 
        --cfg-options data_args.use_icl=True 
        --cfg-options model_args.model_name_or_path=/path/to/checkpoint 
        --per_device_eval_batch_size 1

# ISEKAI-PAIR
accelerate launch --num_processes 4 
        --main_process_port 23786 
        mllm/pipeline/finetune.py 
        config/shikra_eval_multi_pope.py 
        --cfg-options data_args.use_icl=True 
        --cfg-options model_args.model_name_or_path=/path/to/checkpoint 
        --per_device_eval_batch_size 1

其中--cfg-options a=balabala b=balabala是mmengine樣式參數。他們將覆蓋配置文件中預定義的參數。 --per_device_eval_batch_size是huggingface：trainer參數。

預測結果將保存在output_dir/multitest_xxxx_extra_prediction.jsonl中，該訂單與輸入數據集相同。

引用

 @inproceedings { tai2023link ,
  title = { Link-Context Learning for Multimodal LLMs } ,
  author = { Tai, Yan and Fan, Weichen and Zhang, Zhao and Liu, Ziwei } ,
  booktitle = { Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (CVPR) } ,
  year = { 2024 }
}

展開

附加信息

版本
類型其他源碼
更新時間 2025-02-08
大小 32.18MB
來自於 Github

相關應用

Parameter Efficient Transfer Learning Benchmark

2024-11-06
Link Art遊戲

2024-02-21
Ball Link Explosion遊戲

2023-08-13
蒸氣流式盒

2023-04-23
bilibili連結應用程式

2023-04-14
網頁連結驗證器

2009-04-16

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
Sunamu

其他源碼

Release 2.2.0
MySchedule.py

其他源碼

Updates to the fetching of week codes
waymo open dataset

其他源碼

December 2023 Update
termwind

其他類別

v2.3.0
wp functions

其他類別

1.0.0

相關資訊全部