Unduhan LiteFocus - Unduhan kode Sumber LiteFocus

LiteFocus

Kode sumber lainnya

1.0.0

Unduh

Fokus Ringan

LiteFocus: Inferensi Difusi yang Dipercepat untuk Sintesis Audio Panjang
Zhenxiong Tan, Xinyin Ma, Gongfan Fang, dan Xinchao Wang
Lab Pembelajaran dan Visi, Universitas Nasional Singapura

TL;DR (Terlalu Panjang; Tidak Dibaca)

LiteFocus adalah alat yang dirancang untuk mempercepat model TTA berbasis difusi, kini diimplementasikan dengan model dasar AudioLDM2. Ini menggandakan kecepatan pemrosesan dan meningkatkan kualitas audio.

Pengaturan

Siapkan Lingkungan (opsional)

conda create -n litefocus python=3.10
conda activate litefocus

Instal Model Dasar

pip3 install git+https://github.com/haoheliu/AudioLDM2.git

Penggunaan

Penggunaan Dasar

from audioldm2 import text_to_audio, build_model
import scipy

+ from litefocus import inject_lite_focus, disable_lite_focus

model = build_model(model_name='audioldm2-full')

+ inject_lite_focus(model)

waveform = text_to_audio(
    latent_diffusion=model,
    duration=40,
    text='Musical constellations twinkling in the night sky, forming a cosmic melody.',
)

scipy.io.wavfile.write("out.wav", rate=16000, data=waveform)

Nonaktifkan LiteFokus

 disable_lite_focus ( model )

Konfigurasi

 config = {
    'same_frequency' : True ,
    'cross_frequency' : True ,
    'sparse_ratio' : 0.1
}

inject_lite_focus ( model , config )

Parameter	Keterangan	Nilai Bawaan
`same_frequency`	Memungkinkan perhatian pada token yang berbagi frekuensi yang sama.	`True`
`cross_frequency`	Memungkinkan perhatian pada token dalam kompensasi lintas frekuensi.	`True`
`sparse_ratio`	Menentukan rasio ketersebaran untuk `cross_frequency` .	0,1

Agenda

Integrasi AudioLDM2
Integrasi pipa diffuser

Kutipan

 @article{
  tan2024lite,
  title={LiteFocus: Accelerated Diffusion Inference for Long Audio Synthesis},
  author={Zhenxiong Tan, Xinyin Ma, Gongfan Fang, and Xinchao Wang},
  journal={arXiv preprint arXiv:2407.10468},
  year={2024}
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2024-11-30
ukuran 820.11KB
Berasal dari Github

Aplikasi Terkait

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
SmartTube

Kode sumber lainnya

24.71 Stable
Sunamu

Kode sumber lainnya

Release 2.2.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
wp functions

Kategori lainnya

1.0.0
termwind

Kategori lainnya

v2.3.0

Informasi Terkait Semua