AudioGPT ダウンロード - AudioGPT ソースコードのダウンロード

日本語

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

ホーム>プログラミング関連>AI ソースコード

AudioGPT

AI ソースコード

1.0.0

ダウンロード

AudioGPT: 音声、音楽、サウンド、トーキングヘッドの理解と生成

このリポジトリでは、実装と事前トレーニングされたモデルをオープンソースとして提供しています。

始めましょう

run.mdを参照してください。

能力

ここでは、現時点での AudioGPT の機能をリストします。さらに多くのモデルとタスクがサポートされるようになる予定です。プロンプトの例については、アセットを参照してください。

現在、すべてのモデルにリポジトリがあるわけではありません。

スピーチ

タスク	サポートされている基盤モデル	状態
テキスト読み上げ	ファストスピーチ、シンタスピーチ、VITS	はい (WIP)
スタイル転送	一般スピーチ	はい
音声認識	ささやき、適合者	はい
音声強化	ConvTasNet	はい (WIP)
音声の分離	TF-グリッドネット	はい (WIP)
音声翻訳	マルチデコーダ	WIP
モノラルからバイノーラルへ	ニューラルワープ	はい

歌う

タスク	サポートされている基盤モデル	状態
テキストで歌う	ディフシンガー、VISinger	はい (WIP)

オーディオ

タスク	サポートされている基盤モデル	状態
テキストからオーディオへ	オーディオの作成	はい
オーディオの修復	オーディオの作成	はい
画像から音声へ	オーディオの作成	はい
音の検出	オーディオトランスフォーマー	はい
対象音の検出	TSDネット	はい
音声抽出	ラスネット	はい

トーキングヘッド

タスク	サポートされている基盤モデル	状態
トーキングヘッド合成	ジーンフェイス	はい (WIP)

了承

次のプロジェクトのオープンソースに感謝します。

ESPNet NATS音声ビジュアルチャットGPTハグフェイスLangChain安定拡散

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2024-12-10
サイズ 19.42MB
言語簡体字中国語

おすすめ

関連情報すべて