GenHowTo下載 - GenHowTo原始碼下載

GenHowTo

其他源碼

1.0.0

下載

GenHowTo：學習從教學影片產生動作和狀態轉換

[專案網站] [論文？

此儲存庫包含 CVPR'24 論文 GenHowTo：學習從教學影片產生動作和狀態轉換的程式碼。

在圖像和提示上運行模型

環境設定
- 使用提供的Dockerfile建置環境 ( docker build -t genhowto . ) 或手動安裝軟體包 ( pip install diffusers==0.18.2 transformers xformers accelerate )。
- 該程式碼使用 PyTorch 2.0 進行了測試。
下載 GenHowTo 模型權重
- 使用download_weights.sh腳本或手動下載 GenHowTo 權重。
- 我們提供以下權重：
  - GenHowTo-STATES-96h-v1用於產生狀態轉換。
  - GenHowTo-ACTIONS-96h-v1用於產生操作。

取得預測

執行以下命令以取得影像和提示的預測。

 python genhowto.py --weights_path weights/GenHowTo-STATES-96h-v1
                   --input_image path/to/image.jpg
                   --prompt "your prompt"
                   --output_path path/to/output.jpg
                   --num_images 1
                   [--num_steps_to_skip 2]

--num_steps_to_skip是擴散過程中要跳過的步驟數。數字越高，產生的影像與輸入影像越相似。

評估

若要複製我們的評估，請按照評估目錄中的說明進行操作。

引文

 @inproceedings { soucek2024genhowto ,
    title = { GenHowTo: Learning to Generate Actions and State Transformations from Instructional Videos } ,
    author = { Souv{c}ek, Tom'{a}v{s} and Damen, Dima and Wray, Michael and Laptev, Ivan and Sivic, Josef } ,
    booktitle = { Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) } ,
    month = { June } ,
    year = { 2024 }
}

致謝

這項工作得到了 EXA4MIND 計畫下的歐盟地平線歐洲計畫（編號：101092944）和捷克共和國教育、青年和體育部透過 e-INFRA CZ（ID：90140）的部分支持。這項工作的一部分是在布里斯託大學2023 年機器學習和電腦視覺(MaVi) 夏季研究計畫內完成的。 (EP/ T028572/1)。

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2024-12-04
大小 565.72KB
來自於 Github

相關應用

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
SmartTube

其他源碼

24.71 Stable
Sunamu

其他源碼

Release 2.2.0
waymo open dataset

其他源碼

December 2023 Update
wp functions

其他類別

1.0.0
termwind

其他類別

v2.3.0

相關資訊全部