Загрузка LiteFocus - Загрузка исходного кода LiteFocus

LiteFocus

Другой исходный код

1.0.0

Скачать

LiteFocus

LiteFocus: ускоренный диффузионный вывод для синтеза длинного аудио
Чжэньсюн Тан, Синьинь Ма, Гунфань Фан и Синьчао Ван
Лаборатория обучения и видения, Национальный университет Сингапура

TL;DR (слишком долго; не читал)

LiteFocus — это инструмент, предназначенный для ускорения модели TTA на основе диффузии, которая теперь реализована с помощью базовой модели AudioLDM2. Это удваивает скорость обработки и улучшает качество звука.

Настраивать

Подготовьте среду (необязательно)

conda create -n litefocus python=3.10
conda activate litefocus

Установить базовую модель

pip3 install git+https://github.com/haoheliu/AudioLDM2.git

Использование

Основное использование

from audioldm2 import text_to_audio, build_model
import scipy

+ from litefocus import inject_lite_focus, disable_lite_focus

model = build_model(model_name='audioldm2-full')

+ inject_lite_focus(model)

waveform = text_to_audio(
    latent_diffusion=model,
    duration=40,
    text='Musical constellations twinkling in the night sky, forming a cosmic melody.',
)

scipy.io.wavfile.write("out.wav", rate=16000, data=waveform)

Отключить LiteFocus

 disable_lite_focus ( model )

Конфигурация

 config = {
    'same_frequency' : True ,
    'cross_frequency' : True ,
    'sparse_ratio' : 0.1
}

inject_lite_focus ( model , config )

Параметр	Описание	Значение по умолчанию
`same_frequency`	Включает внимание к токенам, использующим одну и ту же частоту.	`True`
`cross_frequency`	Включает внимание к токенам при межчастотной компенсации.	`True`
`sparse_ratio`	Задает коэффициент разреженности для `cross_frequency` .	0,1

Дела

Интеграция AudioLDM2
Интеграция трубопроводов диффузоров

Цитирование

 @article{
  tan2024lite,
  title={LiteFocus: Accelerated Diffusion Inference for Long Audio Synthesis},
  author={Zhenxiong Tan, Xinyin Ma, Gongfan Fang, and Xinchao Wang},
  journal={arXiv preprint arXiv:2407.10468},
  year={2024}
}

Расширять

Дополнительная информация