AudioGPT
1.0.0
Kami menyediakan implementasi dan model terlatih kami sebagai sumber terbuka di repositori ini.
Silakan merujuk ke run.md
Berikut kami cantumkan kemampuan AudioGPT saat ini. Model dan tugas yang lebih didukung akan segera hadir. Untuk contoh cepat, lihat aset.
Saat ini tidak semua model memiliki repositori.
Tugas | Model Fondasi yang Didukung | Status |
---|---|---|
Teks-ke-Ucapan | FastSpeech, SyntaSpeech, VITS | Ya (WIP) |
Perpindahan Gaya | Pidato Umum | Ya |
Pengenalan Ucapan | berbisik, Konformer | Ya |
Peningkatan Bicara | KonvTasNet | Ya (WIP) |
Pemisahan Pidato | TF-GridNet | Ya (WIP) |
Terjemahan Pidato | Multi-dekoder | WIP |
Mono-ke-Binaural | NeuralWarp | Ya |
Tugas | Model Fondasi yang Didukung | Status |
---|---|---|
Teks untuk Dinyanyikan | DiffSinger, VISinger | Ya (WIP) |
Tugas | Model Fondasi yang Didukung | Status |
---|---|---|
Teks-ke-Audio | Buat-An-Audio | Ya |
Lukisan Audio | Buat-An-Audio | Ya |
Gambar-ke-Audio | Buat-An-Audio | Ya |
Deteksi Suara | Transformator audio | Ya |
Deteksi Suara Sasaran | TSDNet | Ya |
Ekstraksi Suara | LASSNet | Ya |
Tugas | Model Fondasi yang Didukung | Status |
---|---|---|
Sintesis Kepala Berbicara | GeneFace | Ya (WIP) |
Kami menghargai open source dari proyek-proyek berikut:
ESPNet NATSpeech Visual ChatGPT Memeluk Wajah Difusi Stabil LangChain