Descarga lip synthesis - lip synthesis Descarga del código fuente

lip synthesis

Código Fuente de IA

1.0.0

Descargar

Síntesis de labios audiovisuales mediante representación de hitos intermedios | Proyecto de fin de año (disertación) de Wish Suharitdamrong

Esta es una implementación de código para el proyecto de último año de Licenciatura en Ciencias de la Computación del tercer año de Wish Suharitdamrong en la Universidad de Surrey sobre el tema de la síntesis de labios audiovisuales a través de la representación de puntos de referencia intermedios.

Texto alternativo

Manifestación

La demostración en línea está disponible en ? AbrazosCara

Instalación

Hay dos formas de instalar paquetes usando conda o pip

1.Cree un entorno virtual de conda desde environment.yml

2.Utilice pip para instalar paquetes (asegúrese de utilizar python 3.7 o superior, ya que es posible que la versión anterior no admita algunas bibliotecas)

Usar Conda

 # Crear un entorno virtual desde el archivo .ymlconda env create -f Environment.yml# activar el entorno virtualconda activar fyp

usar pipa

 # Use pip para instalar require packagespip install -r require.txt

Conjunto de datos

El conjunto de datos audiovisuales utilizados en este proyecto son LRS2 y LRS3. Los datos de LRS2 se utilizaron tanto para el entrenamiento como para la evaluación del modelo. Los datos de LRS3 solo se utilizaron para la evaluación del modelo.

Conjunto de datos	Página
LRS2	Enlace
LRS3	Enlace

Pesos previos al entrenamiento

Modelo de generador

Descargar modelo Generador de pesas

Modelo	Enlace de descarga
Generador	Enlace
Generador + Pérdida de sincronización	Enlace
Generador de atención + SyncLoss	Enlace

Discriminador Landmark SyncNet

Descargar pesos para el modelo SyncNet basado en Landmark Enlace de descarga

Traducción de imagen a imagen

El peso previamente entrenado para el modelo Image2Image Translation se puede descargar desde el repositorio MakeItTalk en la sección Repo Link de modelos previamente entrenados.

Directorio

 ├── punto de control # Directorio para el punto de control del modelo│ └── generador # ponga aquí los pesos del modelo del generador│ └── syncnet # ponga aquí los pesos del modelo de Landmark SyncNet│ └── imagen2imagen # ponga los pesos del modelo de traducción de Imagen2Imagen aquí

Ejecutar inferencia

python run_inference.py --generator_checkpoint <checkpoint_path> --image2image_checkpoint <checkpoint_path> --input_face <image/video_path> --input_audio <audio_source_path>

Preprocesamiento de datos

Utilicé las mismas formas de preprocesamiento de datos que Wav2Lip; puede encontrar más detalles sobre la estructura de carpetas en su repositorio aquí.

python preprocess_data.py --data_root data_root/main --preprocessed_root preprocessed_lrs2_landmark/

Modelo de tren

Generador

# CLI for traning attention generator with pretrain landmark SyncNet discriminator
python run_train_generator.py --model_type attnlstm --train_type pretrain --data_root preprocessed_lrs2_landmark/ --checkpoint_dir <folder_to_save_checkpoints>

SyncNet emblemático

# CLI for training pretrain landmark SyncNet discriminator
python run_train_syncnet.py --data_root preprocessed_lrs2_landmark/ --checkpoint_dir <folder_to_save_checkpoints>

Genere videos para evaluación y evaluación comparativa de LRS2 y LRS3

Este proyecto utilizó datos del conjunto de datos LRS2 y LRS3 para la evaluación cuantitativa; la lista de datos de evaluación se proporciona desde Wav2Lip. La lista de archivos (datos de video y audio utilizados para la evaluación) y los detalles sobre el punto de referencia de Lip Sync están disponibles en su repositorio aquí.

Generar evaluación a partir de la lista de archivos

cd evaluation
# generate evaluation videos
python gen_eval_vdo.py --filelist <path> --data_root <path>  --model_type <type_of_model> --result_dir <save_path> --generator_checkpoint <gen_ckpt> --image2image_checkpoint <image2image_checkpoint>

Reconocimiento

El código base de este proyecto se inspiró en Wav2Lip y MakeItTalk. Me gustaría agradecer al autor de ambos proyectos por hacer que la implementación del código de su increíble trabajo esté disponible en línea.

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2024-12-04
tamaño 1.41MB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
node telegram bot api

Código Fuente de IA

v0.50.0
typebot.io

Código Fuente de IA

v3.1.2
python wechaty getting started

Código Fuente de IA

1.0.0
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo