Voice-Pro:用於轉錄、翻譯和文字轉語音的最佳 gradio Web-ui ?
? 한국어 ∙ 英文 ∙ 中文簡體 ∙ 中文繁體 ∙ 日本語
Voice-Pro 是用於轉錄、翻譯和文字轉語音的最佳 gradio Web-ui。一鍵即可輕鬆安裝。使用 Miniconda 建立虛擬環境,完全獨立於 Windows 系統運作(完全可移植)。支援即時轉錄和翻譯,以及批次模式。
- YouTube 下載器:您可以下載 YouTube 影片並提取音訊(mp3、wav、flac)。
- Vocal Remover :使用UVR5中支援的MDX-Net和Meta開發的Demucs引擎進行語音分離。
- STT :支援使用 Whisper、Faster-Whisper 和 Whisper-timestamped 進行語音到文字轉換。
- 翻譯:Google翻譯。
- TTS :文字轉語音。 Edge-TTS、F5-TTS。
- 更多的...
?運行畫面
TTS
選項卡:使用 F5-TTS 進行播客製作
f5-tts-demo-elon-zuckerberg-1115-3.mp4
Studio
選項卡:轉錄、翻譯和文字轉語音
語音專業演示-v1.5.7-hevc-720p.mp4
主要特點
Studio
選項卡- 提供 YouTube 下載器、噪音消除、字幕、翻譯和 TTS 的整合環境
- ffmpeg支援的所有視訊/音訊格式都可以使用
- 可選擇輸出音訊格式(wav、flac、mp3)
- 100 種語言的語音辨識和字幕創建
- 選擇適合 PC 效能的字幕建立選項(Whisper 模型和計算類型)
- 翻譯成 100 多種語言並透過 TTS 產生語音
- 多語言影片中保留了原始影片的BGM和音效。
- 支援TTS語音速度、音量、音調調節
Whisper Caption
卡
- 專門用於建立字幕的選項卡。支援 90 多種語言
- 顯示使用影片建立的字幕
- 提供世界級亮點功能
- 提供降噪功能(1-Demucs、2-MDXNet)
Translate
選項卡
- 專用翻譯選項卡。支援 100 多種語言
- 支援字幕檔(ass、ssa、srt、mpl2、tmp、vtt、microdvd、json)
- 也可以直接輸入文字
- 自動偵測上傳文件的語言
TTS
選項卡
- 支援 Edge-TTS 和 F5-TTS。
- Edge-TTS 支援超過 100 種語言和 400 多種語音。
- 音高、音量和速度均可調整。
- F5-TTS 支援零樣本語音克隆。
- 您可以使用名人之聲創建播客。
Live Translation
選項卡
- 即時語音辨識和翻譯支持
- 選擇音訊輸入來源,例如麥克風、揚聲器等。
- 提供保存捕獲的音訊、識別的字幕和翻譯的字幕的功能
Batch
選項卡
執行環境
- 作業系統:Windows 10/11(64位元) ※不支援Linux和Mac作業系統。
- GPU:推薦支援CUDA 12.1的NVIDIA顯示卡。
- 顯存:4GB 或更多。建議 8GB 或以上。
- 記憶體:4GB或以上
- HDD:安裝時至少有20GB可用空間
- 需要網路連線(安裝和翻譯工作)
?安裝
Voice-Pro 可輕鬆一鍵安裝。只需執行configure.bat和start.bat
步驟1. 包裝準備
- A、付費版本
- 將 USB 中包含的壓縮檔案 ( voice-pro-x.zip ) 解壓縮到電腦上的適當位置。
- 或者,將已解壓縮的資料夾 ( voice-pro-x ) 複製到電腦上的適當位置。
- B、免費版本
- 從以下位置複製或下載最新版本(原始碼 (zip) )
步驟 2. 安裝並執行程式
- 運行
configure.bat
- 在 Windows 上安裝 git、ffmpeg 和 CUDA(如果使用 NVIDIA GPU)。
- 您只需要第一次運行它。
- 需要網路連接,根據系統的不同,可能需要一個多小時。
- 安裝過程中切勿關閉 Windows 命令視窗。
- 運行
start.bat
- 啟動 Voice-Pro。 Web-UI 將自動運作。
- 首次運行時,請先安裝 Voice-Pro。
- 需要網路連接,根據系統的不同,可能需要一個多小時。
- 安裝過程中切勿關閉 Windows 命令視窗。
- 如果安裝過程中出現問題,請刪除installer_files資料夾並再次執行start.bat。
步驟 3. 卸載程序
- 運行
uninstall.bat
:- 刪除installer_files資料夾。
- 刪除 Windows 上安裝的 ffmepg、git 和 CUDA 軟體包(如果選擇)
- Voice-Pro 標準配備可攜式安裝。要卸載該程序,刪除安裝資料夾就足夠了。
❓提示與技巧
如果瀏覽器沒有自動運行
- 關閉 Windows-Commnad 視窗並再次執行 start.bat。
- 直接執行瀏覽器並在網址列中輸入 Windows 命令視窗中顯示的位址(例如http://127.0.0.1:7892 )。
如果發生 CUDA 記憶體不足錯誤
- 在 Windows 工作管理員 - 效能標籤中檢查 GPU 記憶體狀態。
- 將降噪等級設定為 0 或 1。
- 將計算類型設定為int類型。 float類型的品質更好,但需要更多的GPU記憶體。
如何提高字幕品質?
- 較大的 Whisper 型號往往會提高字幕質量,但情況並非一定如此。大>中>小>基本>小
- 在計算類型中,float類型具有良好的效能。 int類型是一種透過模型量化來減少GPU使用並提高速度的模型。另一方面,性能下降。
- 如果提高降噪級別,則會消除更多背景聲音,僅使用剩餘的聲音進行語音辨識。它並不總是保證好的結果。
?警告
Windows Defender 可能會發出有關不受信任的應用程式的警告,並禁止進一步執行 Voice-Pro。如果 SmartScreen 安全等級設定為“警告”,只需按一下“更多資訊”,然後按一下“仍然運行”。如果 SmartScreen 設定為「封鎖」級別,則不會有用於運行安裝的按鈕。在這種情況下,開啟 start.bat 檔案的屬性,然後選取“取消封鎖”,套用變更並再次執行 start.bat。
當 Windows Defender 錯誤地將批次檔識別為特洛伊木馬時,這通常稱為「誤報」。若要解決此問題,您可以執行以下步驟:
- 檔案異常處理:在Windows Defender中,您可以設定某些檔案或進程跳過安全掃描。為此,請按照以下步驟操作:
- 點擊“開始”按鈕並轉到“設定”。
- 按一下“更新和安全性”。
- 選擇“Windows 安全性”並前往“病毒和威脅防護”。
- 點選“管理病毒和威脅防護設定”。
- 在「病毒和威脅防護設定」中選擇「新增例外」。
- 選擇“文件或資料夾”,找到有問題的批次檔並將其新增為例外。
- 暫時停用 Windows Defender:這可能是臨時解決方案。但是,使用此方法時必須小心,因為它可能會使您的電腦面臨其他威脅。
- 向防毒軟體回報問題:如果您確定該檔案不是特洛伊木馬,則可以將其作為誤報報告給 Microsoft。 Microsoft 將對此進行審查並採取任何必要的措施。
?聯絡我們
- 電子郵件:[email protected]
- 首頁(韓文):https://abuskorea.imweb.me
- 亞馬遜(美國):https://www.amazon.com/dp/B0DBR69JPL
- 亞馬遜(日本):https://www.amazon.co.jp/dp/B0DBVRJ542
- 亞馬遜(新加坡):https://www.amazon.sg/dp/B0DCGKL8R4
- 亞馬遜(阿聯酋):https://www.amazon.ae/dp/B0DCGKM7FF
- 產品資訊 (S/W): https://smartstore.naver.com/abus/products/10385660040
- 解決方案(解決方案):https://smartstore.naver.com/abus/products/10298346364
? Youtube
- 產品資訊:https://youtube.com/playlist?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq&si=873MgzUtu4POE9jO
- 家庭卡拉 OK(流行音樂):https://youtube.com/playlist?list=PLwx5dnMDVC9bVxfGo58U-R-w3fUHqwiD6&si=aWRDfF8TxFp2oAR0
- 家庭卡拉 OK(K-Pop):https://youtube.com/playlist?list=PLwx5dnMDVC9Z8kB01tQKfzTysaCCxC3C8&si=1_-9p722rd_JXpzv
- 家庭卡拉 OK(日本流行音樂):https://youtube.com/playlist?list=PLwx5dnMDVC9apyxrP9LE9PiT821G7lJXk&si=0a474CP7ZIjMoGN9
製作人員
- 德穆克斯:https://github.com/facebookresearch/demucs
- yt-dlp:https://github.com/yt-dlp/yt-dlp
- 漸層:https://github.com/gradio-app/gradio
- 邊緣 TTS:https://github.com/rany2/edge-tts
- F5-TTS:https://github.com/SWivid/F5-TTS.git
©️版權所有
透過阿布斯