decipher
1.0.0
AI生成的轉錄字幕是一種通過使用人工智能從視頻中轉錄音頻來自動添加字幕的一種方式。這消除了對手動轉錄的需求,可以使您的視頻更容易被更廣泛的受眾訪問。 Decipher使用耳語來轉錄視頻中獲取的音頻並創建字幕
Whisper是OpenAI的自動最先進的語音識別系統,已接受了從網絡收集的680,000小時的多語言和多任務監督數據進行培訓。這個大型多樣的數據集可改善對重音,背景噪音和技術語言的魯棒性。
根據您的偏好,有兩種不同的方法開始使用Decipher:
Google Colab
Manual
筆記:
Google Colab是一個基於雲的平台,用於機器學習和數據科學,而無需您自己的強大GPU。它提供了可以在其服務器上免費借用功能強大的GPU(Tesla K80,T4,P4或P100)的選項,每次會議最多12小時。對於那些需要更強大的GPU和更長的運行時間的人,可以使用COLAB PRO/PRO+選項。
Python
ffmpeg
pip install git+https://github.com/dsymbol/decipher
或者
git clone https://github.com/dsymbol/decipher
cd decipher && pip install .
注意:請勿使用“ PIP安裝解密”。它安裝了不同的軟件包。
decipher gui
# or
python -m decipher gui
transcribe
子命令允許您將視頻文件轉錄到子段字幕(SRT)文件中。它還可以選擇自動將生成的字幕添加到視頻中。
subtitle
命令允許您使用已經存在的SRT文件將字幕添加到視頻中。此子命令不執行轉錄,而是假設已經創建了SRT文件。它通常是由想要驗證轉錄子命令產生的轉錄準確性的人使用的。
立即開始:
decipher --help
如果將其作為腳本運行不起作用,則可以將其作為軟件包運行:
python -m decipher --help
為視頻生成SRT字幕:
decipher transcribe -i video.mp4 --model small
刻錄到視頻中的燒傷字幕:
decipher subtitle -i video.mp4 --subtitle_file video.srt --subtitle_action burn
在沒有驗證轉錄的情況下生成和刻錄字幕進入視頻:
decipher transcribe -i video.mp4 --model small --subtitle_action burn