decipher
1.0.0
AI生成的转录字幕是一种通过使用人工智能从视频中转录音频来自动添加字幕的一种方式。这消除了对手动转录的需求,可以使您的视频更容易被更广泛的受众访问。 Decipher使用耳语来转录视频中获取的音频并创建字幕
Whisper是OpenAI的自动最先进的语音识别系统,已接受了从网络收集的680,000小时的多语言和多任务监督数据进行培训。这个大型多样的数据集可改善对重音,背景噪音和技术语言的鲁棒性。
根据您的偏好,有两种不同的方法开始使用Decipher:
Google Colab
Manual
笔记:
Google Colab是一个基于云的平台,用于机器学习和数据科学,而无需您自己的强大GPU。它提供了可以在其服务器上免费借用功能强大的GPU(Tesla K80,T4,P4或P100)的选项,每次会议最多12小时。对于那些需要更强大的GPU和更长的运行时间的人,可以使用COLAB PRO/PRO+选项。
Python
ffmpeg
pip install git+https://github.com/dsymbol/decipher
或者
git clone https://github.com/dsymbol/decipher
cd decipher && pip install .
注意:请勿使用“ PIP安装解密”。它安装了不同的软件包。
decipher gui
# or
python -m decipher gui
transcribe
子命令允许您将视频文件转录到子段字幕(SRT)文件中。它还可以选择自动将生成的字幕添加到视频中。
subtitle
命令允许您使用已经存在的SRT文件将字幕添加到视频中。此子命令不执行转录,而是假设已经创建了SRT文件。它通常是由想要验证转录子命令产生的转录准确性的人使用的。
立即开始:
decipher --help
如果将其作为脚本运行不起作用,则可以将其作为软件包运行:
python -m decipher --help
为视频生成SRT字幕:
decipher transcribe -i video.mp4 --model small
刻录到视频中的烧伤字幕:
decipher subtitle -i video.mp4 --subtitle_file video.srt --subtitle_action burn
在没有验证转录的情况下生成和刻录字幕进入视频:
decipher transcribe -i video.mp4 --model small --subtitle_action burn