Unduh lip synthesis - unduh kode sumber lip synthesis

lip synthesis

Kode Sumber AI

1.0.0

Unduh

Sintesis Bibir Audio-Visua melalui representasi landmark perantara | Proyek Tahun Akhir (Disertasi) Wish Suharitdamrong

Ini adalah implementasi kode untuk Proyek Tahun Terakhir Wish Suharitdamrong Tahun 3 BSc Ilmu Komputer di Universitas Surrey dengan topik Sintesis Bibir Audio-Visua melalui representasi landmark perantara.

Teks Alternatif

Demo

Demonstrasi online tersedia di ? Memeluk Wajah

Instalasi

Ada dua cara menginstal paket menggunakan conda atau pip

1.Buat lingkungan conda virtual dari environment.yml

2.Gunakan pip untuk menginstal paket (pastikan Anda menggunakan python 3.7 atau lebih tinggi karena versi yang lebih lama mungkin tidak mendukung beberapa perpustakaan)

Gunakan Conda

 # Buat lingkungan virtual dari .yml fileconda env buat -f environment.yml# aktifkan lingkungan virtualconda aktifkan fyp

Gunakan pip

 # Gunakan pip untuk menginstal memerlukan paket pip install -r persyaratan.txt

Kumpulan data

Dataset audio visual yang digunakan dalam proyek ini adalah LRS2 dan LRS3. Data LRS2 digunakan untuk pelatihan model dan evaluasi. Data LRS3 hanya digunakan untuk evaluasi model.

Kumpulan data	Halaman
LRS2	Link
LRS3	Link

Beban sebelum latihan

Model pembangkit

Unduh model Generator beban

Model	Unduh Tautan
Generator	Link
Generator + SinkronisasiLoss	Link
Generator Perhatian + SyncLoss	Link

Diskriminator SyncNet yang terkenal

Unduh bobot untuk Tautan Unduhan model SyncNet berbasis Landmark

Terjemahan Gambar-ke-Gambar

Bobot terlatih untuk model Terjemahan Image2Image dapat diunduh dari repositori MakeItTalk di bagian model terlatih mereka, Tautan Repo.

Direktori

 ├── pos pemeriksaan # Direktori untuk pos pemeriksaan model│ └── generator # letakkan bobot model Generator di sini│ └── syncnet # letakkan bobot model Landmark SyncNet di sini│ └── image2image # letakkan bobot model Image2Image Translation di sini

Jalankan Inferensi

python run_inference.py --generator_checkpoint <checkpoint_path> --image2image_checkpoint <checkpoint_path> --input_face <image/video_path> --input_audio <audio_source_path>

Pemrosesan Awal Data

Saya menggunakan cara pemrosesan awal data yang sama seperti Wav2Lip untuk detail lebih lanjut tentang struktur folder dapat ditemukan di repositori mereka Di Sini.

python preprocess_data.py --data_root data_root/main --preprocessed_root preprocessed_lrs2_landmark/

Model Kereta Api

Generator

# CLI for traning attention generator with pretrain landmark SyncNet discriminator
python run_train_generator.py --model_type attnlstm --train_type pretrain --data_root preprocessed_lrs2_landmark/ --checkpoint_dir <folder_to_save_checkpoints>

Sinkronisasi Tengara

# CLI for training pretrain landmark SyncNet discriminator
python run_train_syncnet.py --data_root preprocessed_lrs2_landmark/ --checkpoint_dir <folder_to_save_checkpoints>

Hasilkan video untuk evaluasi & benchmark dari LRS2 dan LRS3

Proyek ini menggunakan data dari dataset LRS2 dan LRS3 untuk evaluasi kuantitatif, daftar data evaluasi disediakan dari Wav2Lip. Daftar file (data video dan audio yang digunakan untuk evaluasi) dan detail tentang benchmark Lip Sync tersedia di repositori mereka Di Sini.

Hasilkan evaluasi dari daftar file

cd evaluation
# generate evaluation videos
python gen_eval_vdo.py --filelist <path> --data_root <path>  --model_type <type_of_model> --result_dir <save_path> --generator_checkpoint <gen_ckpt> --image2image_checkpoint <image2image_checkpoint>

Pengakuan

Basis kode proyek ini terinspirasi dari Wav2Lip dan MakeItTalk. Saya ingin mengucapkan terima kasih kepada penulis kedua proyek yang telah membuat implementasi kode dari karya luar biasa mereka tersedia secara online.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2024-12-04
ukuran 1.41MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua