TTS生成WebUI /口琴
下載安裝程序||安裝|| Docker設置||反饋 /錯誤報告

型號
文本到語音 | 音頻/音樂發電 | 音頻轉換/工具 |
---|
吠 | Musicgen | RVC |
龜 | 磁鐵 | demucs |
maha tts | 穩定的音頻 | VOCOS |
MMS | (擴展)即興 | 耳語 |
vall-e x | (擴展)Audiocraft Mac | |
styletts2 | (擴展)Audiocraft Plus | |
SeamlessM4T | | |
(擴展)XTTSV2 | | |
(擴展)MARS5 | | |
(擴展)F5-TTS | | |
(擴展)Parler TTS | | |
bark.narration.mp4 | bark.japanese.mp4 | Musicgen.mp4 |
---|
ChangElog
11月23日:
- 添加Linux Fairseq Wheel以提高PIP兼容性。
11月22日:
11月15日:
- 升級到Gradio 5.5.5,添加類似於增強(#420)
11月14日:
- 添加實驗性窗戶深速車輪。
- 在樹皮語音克隆中添加更多語言。
11月11日:
- 切換到固定的FairSeq版本,以減少安裝衝突並加速更新。
2024年10月
10月28日:
- 添加了安裝程序測試,模型下載器和pip cpu-for Torch選項。
10月24日:
- 由於錯誤,將Gradio降低到5.1.0。
- 添加了測試工作流和固定次要錯誤。
10月22日:
10月21日:
- 重新設計的讀書文件:改進的耳語擴展,添加了8月,9月和10月的更改,更新了屏幕截圖,並重新組織了內容。
10月19日:
10月18日:
- 系統改進:格式化項目,固定
xformers+cuda
安裝,添加的日誌系統,卸載擴展按鈕和F5 TTS擴展。
10月16日:
- 現在,首先安裝使用
pip
代替uv
。 - 碰撞主要版本並修復了Google Colab。
- 將PIP後備添加到穩定的音頻中。
- 修復了DEMUC,更改了Postgres端口。
- 修復了
huggingface_hub
安裝和樹皮型號加載器。 - 重大升級:切換到Gradio 5,用於選項卡,Docker Fixes,優化的UI速度,添加.ENV.USER功能,改進的日誌和升級的React React UI擴展名。
10月3日:
- 修復了GPU信息選項卡並添加了
nvidia-ml-py
。 - 為Audiocraft Install Bug創建了解決方法。
- 修復了自動MSVC安裝,並將服務器設置為
127.0.0.1
。 - 修復了
.git_version
路徑並刪除了iconv
,以消除node-gyp
要求。 - 改進的安裝程序錯誤處理,添加升級哈希記錄。
- 將node.js升級到22.9.0,添加了postgresql支持,在react ui中分組的選項卡。
2024年9月
單擊以展開
9月23日:
9月22日:
- 添加了FFMPEG元數據擴展以反應UI。
- 為Maha TTS添加了單一通知。
- HotFix避免節點20.17.0安裝失敗。
9月21日:
9月19日:
- 升級的React React UI視覺外觀具有新的滑塊和更好的佈局。
- 優化了RVC UI,修復了Colab,並添加了一個搜索命令框。
- 升級Node.js至20.17.0。
9月2日:
- 修復了Dockerfile和更新的Docker-Compose.yml。
- 修復了NPZ加載中的錯誤。
2024年8月
單擊以展開
8月31日:
- 升級模型推理框架為裝飾器。
- 將Python文件從
src
移至tts_webui
文件夾。 - 重寫MusicGen選項卡並修復了相關的錯誤。
8月20日:
- 升級為Gradio 4並添加了主題。
- 添加了為烏龜加載消息的模型。
- 固定了ReactUI的RVC。
- 重構超參數。
- 將管理添加到擴展名列表,XTTS-Simple擴展名。
8月5日:
- 修復React UI中的樹皮,添加最大生成持續時間。
- 更改Audiocraft加上擴展模型目錄為./data/models/audiocraft_plus/
- 改善MusicGen和Audiogen的模型卸載。將卸載型號按鈕添加到MusicGen和Audiogen。
- 添加HuggingFace高速緩存管理器擴展。
8月4日:
- 添加XTTS-RVC-UI擴展名,XTTS微調演示擴展。
8月3日:
- 添加即興擴展,Audiocraft MAC擴展,樹皮遺產擴展。
8月2日:
- 將折舊警告添加到舊安裝程序中。
- 統一錯誤處理和簡化選項卡加載。
8月1日:
- 為外部擴展添加“嘗試更新”按鈕。
- 當不更改pip_packages版本時,跳過重新安裝軟件包。
- 將Gradio端口與React UI同步。
- 將默認的Gradio端口從7860更改為7770。
2024年7月
單擊以展開
7月31日:
- Fix React React UI的MusicGEN發生變化後。
- 添加卸載按鈕以竊竊私語。
7月29日:
- 將FFMPEG從Conda-Forge更改為4.4.2,以支持包括Mac M1在內的更多平台。
- 禁用烏龜CVVP。
7月26日:
- 耳語延伸
- 實驗AMD ROCM安裝支持。 (僅Linux)
7月25日:
- 添加用於MacOS和Linux的診斷腳本。
- 為選項卡添加更好的錯誤詳細信息。
- 修復了Linux和MacOS上安裝程序的.SH腳本執行權限。
7月21日:
- 添加畫廊歷史擴展(從舊畫廊視圖改編)
- 將簡單的混音器轉換為擴展程序
- FIX update.py使用較新的火炬版本(update.py僅用於遺產目的,可能會破裂)
- 添加診斷腳本並為Windows重新安裝腳本。
7月20日:
- 修復Discord加入鏈接
- 進一步簡化樹皮,消除代碼中過度複雜性。
- 添加UI/模塊化擴展,這些擴展允許在UI上安裝新的型號和功能。將來,模型將以擴展為啟動,然後再添加。
- 輸出中禁用畫廊視圖
- 已知問題:Firefox未能顯示出Gradio的輸出,從而從後端獲取它們失敗了。在React UI中,這可以正常工作。
7月15日:
- 評論 - 隨著React UI已經很長時間了,Gradio UI將只能為用戶提供功能,而沒有極為複雜的UI無法處理的功能。開發時間確實缺乏增加新的模型和功能,但是舊的集成方式並不可行。由於定義了新的API和“模型的作用”,因此可以為整個模型具有擴展名,從而更加靈活性和更輕的安裝。
- 開始縮放縮放Gradio UI複雜性 - 刪除發送到RVC/DEMUC/語音按鈕。 (刪除內部組件Joutai)。
- 添加版本。將來以獲得更好的更新。
- 將Gradio Bark的最大輸出數減少到1。
- 將卸載模型按鈕添加到烏龜中,還要在加載下一個/更改參數之前卸載模型,因此烏龜在設置時不再使用2X模型存儲器。
7月14日:
- 重組級別選項卡成組 - 文本到語音,音頻轉換,音樂生成,輸出和設置
- 清理標題,添加鏈接以進行反饋
- 將種子控制添加到穩定的音頻
- 用新線修復穩定的音頻文件名錯誤
- 禁用“簡單混音” Gradio選項卡
- 再次修復樹皮語音克隆和RVC
- 添加用於調試的“已安裝軟件包”選項卡
7月13日:
- 大量升級到火炬2.3.1和Xformers 0.0.27
- 現在,包括Mac和CPU在內的所有用戶現在都具有相同的Pytorch版本。
- 將CUDA升級到11.8
- 強制Python為3.10.11
- 修改安裝程序以允許升級Python和Torch而不重新安裝(當前主要版本2)
- 修復磁鐵默認參數以提高質量
- 改進安裝程序腳本檢查以避免錯誤
- 更新STYLETTS2
7月11日:
- 改善穩定的音頻生成文件名
- 將力重新安裝到火炬修復中
- 在運行之前將安裝程序自動更新
7月9日:
- https://github.com/xeraster修復了新的安裝程序和安裝說明!
7月8日:
- 更改安裝過程,以減少包裝衝突並啟用火炬版本靈活性。
7月6日:
- 新的基於MAMBA的安裝程序的初始版本。
- 將穩定的音頻結果保存到Outputs-RVC/StableAudio文件夾中。
- 將免責聲明添加到穩定的音頻模型選擇中,並在丟失文件時顯示更好的錯誤消息。
7月1日:
- 一代後優化穩定的音頻內存使用。
- 僅當Gradio也自動打開時,Open React UI會自動。
- 刪除不必要的conda git重新安裝。
- 更新到具有國會議員支持的LAST穩定音頻(需要更新的火炬版本)。
2024年6月
單擊以展開
6月22日: *將穩定音頻添加到Gradio中。 6月21日:
- 添加vall-ex演示以反應UI。
- 在瀏覽器中自動打開React UI,再次修復鏈接。
- 添加長度分開以反應/烏龜。
- 修復UVR5演示文件夾。
- 將FairSeq版本設置為Linux和Mac的0.12.2。 (#323)
- 改善所有React UI選項卡的發電歷史記錄。
5月17日:
5月9日:
- 添加MMS以反應UI。
- 改進React UI和代碼庫。
5月4日:
2024年4月
單擊以展開
4月28日: *添加maha tts以反應UI。 *添加GPU信息以進行反應UI。 4月6日:
- 添加vall-ex生成演示選項卡。
- 添加MMS演示選項卡。
- 添加Maha TTS演示選項卡。
- 添加STYLETTS2演示選項卡。
4月5日:
- 修復RVC安裝錯誤。
- 添加基本UVR5演示選項卡。
4月4日:
- 升級RVC包括RVMPE和FCPE。由於文件重複,刪除模型和索引的直接文件輸入。改進RVC的React UI接口。
2024年3月
單擊以展開
3月28日:
3月27日:
3月26日:
3月22日:
- VALL-E X演示通過筆記本(#292)
- 將React UI添加到Docker圖像
- 添加安裝免責聲明
3月16日:
3月14日:
3月13日:
- 添加實驗管道(bark / tortoise / musicgen / audiogen /磁鐵 - > rvc / demucs / vocos)(#287)
- 用模型重新加載在每一代中修復RVC錯誤。對於簡短的輸入,會導致可見的加速。
3月11日:
- 添加為音頻播放,然後將聲音保存到樹皮(#286)
- 更改UX以顯示文件已從收藏夾中刪除
- 修復未顯示的樹皮聲音的圖像
- 將音頻播放修復到收藏夾中
3月10日:
- 將批處理添加到React UI磁鐵(#283)
- 將音頻翻譯添加到SeamlessM4T(#284)
3月5日:
- 添加批處理為UI Musicgen(#281),多虧了https://github.com/aamir3d請求此信息並提供反饋
3月3日:
- 添加MMS演示作為筆記本
- 添加MultibandDiffusion高VRAM免責聲明
2024年2月
單擊以展開
2月21日:
- 使用Docker-audiocraft修復Docker容器構建和錯誤
2月8日:
- 修復Musicgen的立體模型的多鍵式插圖,謝謝https://github.com/mykeehu
- 修復Google Colab上的Node.js安裝步驟,https://github.com/miaohf代碼
2月6日:
- 通過https://github.com/joachip添加FLAC文件生成擴展
2024年1月
單擊以展開
1月21日:
- 在每個更新中添加CPU/M1 TORCH自動修復腳本。要禁用,編輯check_cuda.py並更改force_no_repair = true
1月16日:
- 升級音樂,增加了對立體聲和大型旋律模型的支持
- 添加磁鐵
1月15日:
- 將Gradio升至3.48.0
- 出現了幾個視覺錯誤,如果它們很關鍵,請報告它們或降級Gradio。
- Gradio:壓制無用的警告
- Supress Triton警告
- Gradio-Bark:修復“將最後一代用作歷史記錄”行為,空選擇不再錯誤
- 改善擴展程序裝載機顯示器
- 從4.31.0升級到4.36.1
- 添加SeamlessM4T演示
1月14日:
1月13日:
- React UI:修復了自動安裝中缺少NPM構建步驟
1月12日:
- React UI:修復音頻動作的名稱
- Gradio:修復多個API警告
- 集成 - React UI現在與Gradio一起啟動,並具有打開它的鏈接
1月11日:
1月9日:
- 反應UI
- 修復404處理程序的WaveSurfer
- 小組樹皮選項卡在一起
1月8日:
2023
單擊以展開
2023年10月
10月26日:
10月24日:
- 為MusicGen和Demucs添加初始React UI(#202)
- 修復樹皮長的種子漂移(感謝https://github.com/520pig520)
2023年9月
9月21日:
- 樹皮:添加繼續作為語義歷史記錄按鈕
- 切換到GitHub Docker Image Storage,新Docker圖像:
-
docker pull ghcr.io/rsxdalv/tts-generation-webui:main
- fix server_port選項在配置#168中,感謝https://github.com/dartvauder
9月9日:
- 修復XDG-OPEN命令行,感謝https://github.com/jfronny
- 修復多行樹皮世代,感謝https://github.com/slack-t和https://github.com/bkutasi
- 按照https://github.com/aamir3d的要求將卸載模型按鈕添加到樹皮
- 根據https://github.com/maki9009添加紅色的細節到readme_bark.md
- 添加“可選”及時燃燒,多虧https://github.com/maki9009
9月5日:
- 將聲音混合添加到樹皮
- 添加V1燒傷提示為吠叫(燃燒在提示中是用於指導語義模型而無需花費時間生成音頻。V1通過生成語義令牌,然後將其用作語義模型的提示來起作用。)
- 將生成長度限制器添加到樹皮
2023年8月
8月27日:
8月26日:
- 將發送到RVC,DEMUCS,VOCOS按鈕和VOCOS添加到RVC,VOCOS按鈕
8月24日:
- 將日期添加到RVC輸出中以修復#147
- 修復Safetensors缺少車輪
- 將發送到demucs按鈕添加到Musicgen
8月21日:
- 添加Torchvision安裝到Colab中以進行Musicgen問題修復
- 刪除RVC_TAB文件記錄
8月20日:
8月18日:
- CI:添加GitHub操作以自動發布Docker映像。
8月16日:
8月15日:
- 在所有需求中,pin torch to 2.0.0.txt文件
- 顛簸的聽力和樹皮版本
- 從Colab中刪除烏龜變壓器修復
- 將烏龜更新為2.8.0
8月13日:
8月11日:
- 感謝Manmay-Nakhashi的烏龜熱五十條
- 添加烏龜選項以更改令牌
8月8日:
- 更新聽力,改善多型延伸性能
- 修復烏龜參數“ cond_free”與“ ultra_fast”預設的不匹配
8月7日:
8月6日:
- 修復Audiogen + MBD錯誤,為Colab添加烏龜修復
8月4日:
- 添加多鍵式選項到Musicgen#109
- MusicGen/Audiogen將代幣作為.NPZ文件保存。
8月3日:
8月2日:
2023年7月
7月26日:
- 語音庫
- 語音裁剪
- 修復語音重命名錯誤,重命名圖片,添加哈希文本框
- 更容易下載聲音(#98)
7月24日:
- 更改樹皮文件格式以包含歷史記錄哈希:... contun_generation ... - > ... from_3ea0d063 ...
7月23日:
- docker圖像感謝https://github.com/jonfairbanks
- RVC UI命名改進
7月21日:
- 修復Hubert不僅與CPU合作(#87)
- 添加Google COLAB演示(#88)
- 新設置選項卡和模型位置(適用於高級用戶)(#90)
7月19日:
- 添加烏龜優化,謝謝https://github.com/manmay-nakhashi#79(實施#18)
7月16日:
- 語音照片演示
- 將目錄添加到存儲RVC模型/索引和下拉列表中
- 解決RVC不尊重CPU#74的IS_HALF
- 烏龜模型和語音選擇改進#73
7月10日:
7月9日:
- RVC Demo + Tortoise,帶更新腳本的V6安裝程序和自動嘗試安裝額外模塊#66
7月5日:
7月2日:
7月1日:
2023年6月
6月29日:
6月27日:
6月20日
6月19日
6月18日:
6月14日:
6月5日:
- 修復Bark生成頁面上的“保存到收藏夾”按鈕,清理控制台(v4.1.1)
- 添加“收集”選項卡,用於管理幾個不同的數據集和更容易的趨勢。
6月4日:
6月3日:
- 更新到V4-新的輸出結構,改進的歷史記錄視圖,代碼庫重組,改進的元數據,輸出擴展支持支持
2023年5月
5月21日:
5月17日:
- 更新到V2 - 生成結果時產生結果,逐行預覽較長的提示世代,啟用多達9個輸出,UI調整
5月16日:
- 添加Gradio設置選項卡,修復控制台中的Gradio錯誤,改進日誌記錄。
- 使用“用作語音”和“保存語音”按鈕更新歷史記錄和收藏夾
- 添加聲音選項卡
- 樹皮選項卡:刪除“或將最後一代用作歷史記錄”
- 改善代碼組織
5月13日:
- 啟用確定性生成並增強生成的日誌。信用Suno-ai/樹皮#175。
5月10日:
- 啟用可能從老一輩重複歷史提示的可能性。將幾代保存為NPZ文件。添加一種方便的方法,用於為下一個提示重用最近3代中的任何一個。添加一個按鈕,用於保存和收集歷史記錄提示 /聲音。 #10
5月4日:
- 長期生成(信用https://github.com/suno-ai/bark/blob/main/notebooks/long_form_generation.ipynb and suno-ai/bark#161)
- 適應固定的env var錯誤
5月3日:
- 改進的烏龜UI:語音,預設和CVVP設置以及產生3個結果的能力(#6)
5月2日:
- 增加了對歷史記錄回收的支持,以繼續手動提示更長的提示
- 增加了對V2提示的支持
前:
升級(用於舊安裝)
如果出現問題,請隨時與開發人員聯繫。
單擊以展開
從V6升級到新安裝程序
推薦:新安裝
- 下載新版本並運行start_tts_webui.bat(Windows)或start_tts_webui.sh(MacOS,Linux)
- 完成後,關閉服務器。
- 推薦:將舊幾代複製到新目錄,例如收藏夾/輸出/ outputs-rvc/ models/ collections/ config.json
- 謹慎:您可以將全新的TTS生成Webui目錄複製到舊的TTS-Generation-Webui目錄,但可能會丟失一些舊文件。
就地升級,可以刪除一些文件,調整
- 使用update_平台腳本更新現有安裝
- 更新後運行新的start_tts_webui.bat(Windows)或start_tts_webui.sh(macos,linux)在tts-generation-webui目錄內
- 服務器啟動後,檢查是否有效。
- 謹慎:如果新服務器有效,則在單鍵式插件目錄中刪除舊的installer_files。
還有其他最佳方法可以做到嗎?
不確定的是,依賴關係發生衝突,尤其是在康達(Conda)和python之間(依賴項已經處於臨界狀態,將其轉移到康達(Conda)是途中的)。因此,雖然有可能只用新的安裝程序替換舊安裝程序並運行更新,但問題是無法預測和不可修復的。對安裝程序進行更新需要大量的測試,因此不會輕易完成。
安裝
- 下載最新版本並提取。
- 運行start_tts_webui.bat或start_tts_webui.sh啟動服務器。它會要求您選擇所使用的GPU/芯片。一旦安裝了所有內容,它將在http:// localhost:7770和http:// localhost:3000的React UI上啟動Gradio服務器。
- 輸出日誌將在installer_scripts/output.log文件中可用。
手動安裝(不建議)
這些說明可能無法反映所有最新的修復和調整,但可作為調試或理解安裝程序的參考。希望它們可以成為支持新平台(例如AMD/Intel)的基礎。
安裝Conda(https://docs.conda.io/projects/conda/en/latest/user-guide/install/index.html)
- (Windows)安裝Visual Studio編譯器/Visual Studio構建工具
建立環境: conda create -n venv
安裝git,node.js conda install -y -c conda-forge git python=3.10.11 conda-forge::nodejs=22.9.0 conda pip==23.3.2 conda-forge::uv=0.4.17 conda-forge::vswhere
a)要么繼續使用安裝程序腳本
- 激活環境:
conda activate venv
和 (venv) node installer_scriptsinit_app.js
- 然後使用
(venv) python server.py
運行服務器
b)或手動安裝要求
- 使用CUDA或CPU設置Pytorch(https://pytorch.org/audio/stable/build.windows.html#install-pytorch):
-
(venv) conda install -y -k conda-forge::uv=0.4.17 conda-forge::vswhere conda-forge::postgresql=16.4 conda-forge::nodejs=22.9.0 conda-forge::ffmpeg=4.4.2[build=lgpl*] pytorch=2.3.1 torchvision torchaudio cpuonly -c pytorch
for cpu/mac -
(venv) conda install -y -k conda-forge::uv=0.4.17 conda-forge::vswhere conda-forge::postgresql=16.4 conda-forge::nodejs=22.9.0 conda-forge::ffmpeg=4.4.2[build=lgpl*] pytorch[version=2.3.1,build=py3.10_cuda11.8*] pytorch-cuda=11.8 torchvision torchaudio cuda-toolkit ninja -c pytorch -c nvidia/label/cuda-11.8.0 -c nvidia
for cuda
- 克隆回購:
git clone https://github.com/rsxdalv/tts-generation-webui.git
- 安裝要求:
- 安裝所有要求*.txt(此列表可能不是最新的,請檢查https://github.com/rsxdalv/tts-generation-webui/blob/main/main/main/dockerfile#l39-l40):
-
(venv) pip install -r requirements.txt
-
(venv) pip install -r requirements_audiocraft.txt
-
(venv) pip install -r requirements_bark_hubert_quantizer.txt
-
(venv) pip install -r requirements_rvc.txt
-
(venv) pip install hydra-core==1.3.2
-
(venv) pip install -r requirements_styletts2.txt
-
(venv) pip install -r requirements_vall_e.txt
-
(venv) pip install -r requirements_maha_tts.txt
-
(venv) pip install -r requirements_stable_audio.txt
-
(venv) pip install soundfile==0.12.1
-
(venv) pip install nvidia-ml-py
- 構建React App :(
(venv) cd react-ui && npm install && npm run build
- (可選)設置數據庫:(
(venv) node installer_scripts/js/applyDatabaseConfig.js
- 運行服務器:(
(venv) python server.py
反應UI
- 安裝nodejs(如果尚未使用conda安裝)
- 安裝反應依賴性:
npm install
- 構建React:
npm run build
- Run React:
npm start
- 還運行Python服務器:
python server.py
或使用start_tts_webui
腳本
Docker設置
TTS生成 - Webui也可以在Docker容器內部運行。要開始,請從github容器註冊表中取出圖像:
docker pull ghcr.io/rsxdalv/tts-generation-webui:main
一旦拉動圖像,可以從Docker組成的開始:
在後台下載模型時,容器將花費一些時間來生成第一個輸出。可以通過檢查容器日誌來驗證此下載的狀態:
docker logs tts-generation-webui
自己構建圖像
如果您想構建自己的Docker容器,則可以使用隨附的Dockerfile:
docker build -t tts-generation-webui .
請注意,需要編輯Docker-Compose才能使用您剛剛構建的圖像。
樹皮的額外聲音,提示樣品
樹皮雷德姆
readme_bark.md
有關AI項目的管理模型,緩存和系統空間的信息
#186(在線程中回复)
開源庫
該項目利用以下開源庫:
道德和負責任的使用
該技術旨在實現促進和創造力,而不是危害。
通過與這種AI模型互動,您承認並同意遵守這些準則,以負責任的,道德和法律的方式採用AI模型。
- 非惡意的意圖:請勿將此AI模型用於惡意,有害或非法活動。它只能用於合法和道德目的,以促進積極參與,知識共享和建設性對話。
- 沒有模仿:不要使用這種AI模型來冒充或虛假陳述自己作為其他人,包括個人,組織或實體。它不應用來欺騙,欺詐或操縱他人。
- 沒有欺詐活動:這種AI模型不得用於欺詐目的,例如財務騙局,網絡釣魚嘗試或任何形式的欺騙性實踐,旨在獲取敏感信息,貨幣收益或未經授權的系統訪問。
- 法律合規:確保您使用此AI模型符合有關AI使用,數據保護,隱私,知識產權以及您管轄範圍內的任何其他相關法律義務的適用法律,法規和政策。
- 致謝:通過使用這種AI模型,您承認並同意以負責任,道德和法律方式使用AI模型,並同意遵守這些準則。
執照
代碼庫和依賴項
該代碼庫是根據MIT許可的。但是,重要的是要注意,在安裝依賴項時,您也將受到各自的許可。儘管這些許可證中的大多數都是允許的,但可能沒有一些許可證。因此,必須了解,允許許可僅適用於代碼庫本身,而不是整個項目。
話雖如此,目的是在整個項目中保持MIT兼容性。如果您遇到與MIT許可證不兼容的依賴性,請隨時打開問題並引起我們的注意。
已知的非允許依賴性:
圖書館 | 執照 | 筆記 |
---|
Eccodec | CC BY-NC 4.0 | 較新的版本是麻省理工學院,但需要手動安裝 |
diffq | CC BY-NC 4.0 | 將來可以卸載的可選,不需要運行,應使用demucs更新 |
la腳 | GPL許可證 | 未來版本將使它成為LGPL,但需要手動安裝 |
UNIDECODE | GPL許可證 | 不關鍵的任務可以用另一個圖書館代替:Neonbjb/Tortoise-TTS#494 |
模型重量
模型權重有不同的許可證,請注意您使用的模型的許可。
最值得注意的是:
- 樹皮:麻省理工學院
- 烏龜:未知(根據repo的apache-2.0,但在擁抱面中沒有許可證文件)
- Musicgen:CC BY-NC 4.0
- Audiogen:CC BY-NC 4.0
兼容性 /錯誤
Audiocraft目前僅與Linux和Windows兼容。 MacOS支持仍然沒有到達,儘管可以手動安裝。
火炬被重新安裝
由於Python軟件包管理器(PIP)限制,火炬可以重新安裝多次。這是PIP和火炬的廣泛問題。
控制台中的紅色消息
這些消息:
---- requires ----, but you have ---- which is incompatible.
完全正常。這既是PIP的限制,又是因為此Web UI將許多不同的AI項目結合在一起。由於這些項目並不總是彼此兼容,因此他們會抱怨安裝的其他項目。這是正常且預期的。最後,儘管有警告/錯誤,項目仍將共同起作用。目前尚不清楚這種情況是否可以解決,但這是希望。