lip synthesis ดาวน์โหลด - lip synthesis ดาวน์โหลดซอร์สโค้ด

lip synthesis

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

การสังเคราะห์เสียง-ภาพริมฝีปากผ่านการแสดงจุดสังเกตระดับกลาง | โครงการปีสุดท้าย (วิทยานิพนธ์) วิช สุหฤทธิ์ดำรง

นี่คือการนำโค้ดไปใช้ในโครงการปีสุดท้ายของวิช สุหฤทดำรงค์ ปี 3 วิทยาการคอมพิวเตอร์ BSc ที่มหาวิทยาลัยเซอร์เรย์ ในหัวข้อการสังเคราะห์เสียงและภาพริมฝีปากผ่านการแสดงจุดสังเกตระดับกลาง

ข้อความแสดงแทน

สาธิต

สามารถสาธิตออนไลน์ได้ที่ ? กอดใบหน้า

การติดตั้ง

มีสองวิธีในการติดตั้งแพ็คเกจโดยใช้ conda หรือ pip

1. สร้างสภาพแวดล้อม conda เสมือนจาก environment.yml

2. ใช้ pip เพื่อติดตั้งแพ็คเกจ (ตรวจสอบให้แน่ใจว่าคุณใช้ python 3.7 ขึ้นไปเนื่องจากเวอร์ชันเก่าอาจไม่รองรับบางไลบรารี)

ใช้คอนด้า

 # สร้างสภาพแวดล้อมเสมือนจาก .yml fileconda env สร้าง -f สภาพแวดล้อม yml# เปิดใช้งานสภาพแวดล้อมเสมือน conda เปิดใช้งาน fyp

ใช้ปิ๊ป

 # ใช้ pip เพื่อติดตั้งต้องใช้ packagespip ติดตั้ง -rrequire.txt

ชุดข้อมูล

ชุดข้อมูลภาพและเสียงที่ใช้ในโครงการนี้คือ LRS2 และ LRS3 ข้อมูล LRS2 ถูกใช้สำหรับทั้งการฝึกโมเดลและการประเมินผล ข้อมูล LRS3 ใช้สำหรับการประเมินแบบจำลองเท่านั้น

ชุดข้อมูล	หน้าหนังสือ
แอลอาร์เอส2	ลิงค์
แอลอาร์เอส3	ลิงค์

ตุ้มน้ำหนักก่อนการฝึก

เครื่องกำเนิดไฟฟ้ารุ่น

ดาวน์โหลดแบบจำลองเครื่องกำเนิดตุ้มน้ำหนัก

แบบอย่าง	ลิงค์ดาวโหลด
เครื่องกำเนิดไฟฟ้า	ลิงค์
เครื่องกำเนิด + SyncLoss	ลิงค์
เครื่องกำเนิดความสนใจ + SyncLoss	ลิงค์

ตัวแบ่งแยก Landmark SyncNet

ดาวน์โหลดน้ำหนักสำหรับลิงก์ดาวน์โหลดโมเดล SyncNet ที่ใช้ Landmark

การแปลภาพเป็นภาพ

น้ำหนักที่ฝึกล่วงหน้าสำหรับโมเดลการแปล Image2Image สามารถดาวน์โหลดได้จากพื้นที่เก็บข้อมูล MakeItTalk บนส่วน Repo Link ของโมเดลที่ฝึกไว้แล้ว

ไดเรกทอรี

 ├── จุดตรวจ # ไดเร็กทอรีสำหรับจุดตรวจสอบโมเดล│ └── ตัวสร้าง # ใส่น้ำหนักโมเดลตัวสร้างที่นี่│ └── syncnet # ใส่น้ำหนักโมเดล Landmark SyncNet ที่นี่│ └── image2image # ใส่น้ำหนักโมเดลการแปล Image2Image ที่นี่

เรียกใช้การอนุมาน

python run_inference.py --generator_checkpoint <checkpoint_path> --image2image_checkpoint <checkpoint_path> --input_face <image/video_path> --input_audio <audio_source_path>

การประมวลผลข้อมูลล่วงหน้า

ฉันใช้วิธีการประมวลผลข้อมูลล่วงหน้าแบบเดียวกันกับ Wav2Lip สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับโครงสร้างโฟลเดอร์สามารถพบได้ในพื้นที่เก็บข้อมูล ที่นี่

python preprocess_data.py --data_root data_root/main --preprocessed_root preprocessed_lrs2_landmark/

โมเดลรถไฟ

เครื่องกำเนิดไฟฟ้า

# CLI for traning attention generator with pretrain landmark SyncNet discriminator
python run_train_generator.py --model_type attnlstm --train_type pretrain --data_root preprocessed_lrs2_landmark/ --checkpoint_dir <folder_to_save_checkpoints>

แลนด์มาร์ค SyncNet

# CLI for training pretrain landmark SyncNet discriminator
python run_train_syncnet.py --data_root preprocessed_lrs2_landmark/ --checkpoint_dir <folder_to_save_checkpoints>

สร้างวิดีโอสำหรับการประเมินผลและการวัดประสิทธิภาพจาก LRS2 และ LRS3

โปรเจ็กต์นี้ใช้ข้อมูลจากชุดข้อมูล LRS2 และ LRS3 สำหรับการประเมินเชิงปริมาณ รายการข้อมูลการประเมินได้มาจาก Wav2Lip รายการไฟล์ (ข้อมูลวิดีโอและเสียงที่ใช้ในการประเมิน) และรายละเอียดเกี่ยวกับเกณฑ์มาตรฐาน Lip Sync มีอยู่ในพื้นที่เก็บข้อมูล ที่นี่

สร้างการประเมินผลจากรายการไฟล์

cd evaluation
# generate evaluation videos
python gen_eval_vdo.py --filelist <path> --data_root <path>  --model_type <type_of_model> --result_dir <save_path> --generator_checkpoint <gen_ckpt> --image2image_checkpoint <image2image_checkpoint>

รับทราบ

ฐานโค้ดของโปรเจ็กต์นี้ได้รับแรงบันดาลใจจาก Wav2Lip และ MakeItTalk ฉันอยากจะขอบคุณผู้เขียนทั้งสองโครงการสำหรับการนำโค้ดไปใช้ในงานที่น่าทึ่งของพวกเขาทางออนไลน์

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2024-12-04
ขนาด 1.41MB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
node telegram bot api

โค้ดแหล่งที่มา AI

v0.50.0
typebot.io

โค้ดแหล่งที่มา AI

v3.1.2
python wechaty getting started

โค้ดแหล่งที่มา AI

1.0.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด