AudioGPT
1.0.0
Wir stellen unsere Implementierung und vorab trainierten Modelle als Open Source in diesem Repository zur Verfügung.
Bitte beachten Sie run.md
Hier listen wir die aktuelle Leistungsfähigkeit von AudioGPT auf. Weitere unterstützte Modelle und Aufgaben folgen in Kürze. Beispiele für Eingabeaufforderungen finden Sie im Asset.
Derzeit verfügt nicht jedes Modell über ein Repository.
Aufgabe | Unterstützte Foundation-Modelle | Status |
---|---|---|
Text-to-Speech | FastSpeech, SyntaSpeech, VITS | Ja (WIP) |
Stilübertragung | GenerSpeech | Ja |
Spracherkennung | Flüstern, Konformer | Ja |
Sprachverbesserung | ConvTasNet | Ja (WIP) |
Sprachtrennung | TF-GridNet | Ja (WIP) |
Sprachübersetzung | Multi-Decoder | In Bearbeitung |
Mono-zu-binaural | NeuralWarp | Ja |
Aufgabe | Unterstützte Foundation-Modelle | Status |
---|---|---|
Text-to-Sing | DiffSinger, VISinger | Ja (WIP) |
Aufgabe | Unterstützte Foundation-Modelle | Status |
---|---|---|
Text-to-Audio | Make-An-Audio | Ja |
Audio-Inpainting | Make-An-Audio | Ja |
Bild-zu-Audio | Make-An-Audio | Ja |
Geräuscherkennung | Audio-Transformator | Ja |
Zielgeräuscherkennung | TSDNet | Ja |
Tonextraktion | LASSNet | Ja |
Aufgabe | Unterstützte Foundation-Modelle | Status |
---|---|---|
Talking-Head-Synthese | GeneFace | Ja (WIP) |
Wir schätzen die Open Source der folgenden Projekte:
ESPNet NATSpeech Visual ChatGPT Hugging Face LangChain Stabile Diffusion