Téléchargement AudioGPT - Téléchargement du code source AudioGPT

AudioGPT

Code Source AI

1.0.0

Télécharger

AudioGPT : comprendre et générer de la parole, de la musique, du son et une tête parlante

Nous fournissons notre implémentation et nos modèles pré-entraînés en open source dans ce référentiel.

Commencer

Veuillez vous référer à run.md

Capacités

Nous répertorions ici les capacités d'AudioGPT à l'heure actuelle. D'autres modèles et tâches pris en charge seront bientôt disponibles. Pour des exemples rapides, reportez-vous à l'actif.

Actuellement, tous les modèles ne disposent pas d'un référentiel.

Discours

Tâche	Modèles de fondation pris en charge	Statut
Synthèse vocale	FastSpeech, SyntaSpeech, VITS	Oui (en cours)
Transfert de style	GenerSpeech	Oui
Reconnaissance vocale	murmure, conformiste	Oui
Amélioration de la parole	ConvTasNet	Oui (en cours)
Séparation de la parole	TF-GridNet	Oui (en cours)
Traduction vocale	Multi-décodeur	En-cours
Mono-à-Binaural	Déformation neuronale	Oui

Chanter

Tâche	Modèles de fondation pris en charge	Statut
Texter pour chanter	DiffSinger, VISinger	Oui (en cours)

Audio

Tâche	Modèles de fondation pris en charge	Statut
Texte vers audio	Créer un audio	Oui
Peinture audio	Créer un audio	Oui
Image vers audio	Créer un audio	Oui
Détection sonore	Transformateur audio	Oui
Détection du son cible	TSDNet	Oui
Extraction du son	LASSNet	Oui