AI 생성 전사 자막은 인공 지능을 사용하여 비디오에서 오디오를 전사하여 비디오에 자막을 자동으로 추가하는 방법입니다. 이렇게하면 수동 전사가 필요하지 않으며 더 많은 청중이 비디오에 더 액세스 할 수 있습니다. Decipher는 Whisper를 사용하여 비디오에서 가져온 오디오를 전사하고 자막을 만듭니다.
Whisper는 OpenAi의 자동 최첨단 음성 인식 시스템으로 웹에서 수집 한 680,000 시간의 다국어 및 멀티 태스킹 감독 데이터에 대해 교육을 받았습니다. 이 크고 다양한 데이터 세트는 악센트, 배경 소음 및 기술 언어에 대한 견고성을 향상시킵니다.
선호도에 따라 해독을 시작하는 두 가지 방법이 있습니다.
Google Colab
Manual
참고 :
Google Colab은 기계 학습 및 데이터 과학을위한 클라우드 기반 플랫폼으로, 강력한 GPU가 필요하지 않고 무료로 제공됩니다. 서버에서 강력한 GPU (Tesla K80, T4, P4 또는 P100)를 세션 당 최대 12 시간 동안 무료로 빌릴 수있는 옵션을 제공합니다. 더 강력한 GPU와 더 긴 런타임이 필요한 사람들에게는 Colab Pro/Pro+ 옵션을 사용할 수 있습니다.
Python
ffmpeg
pip install git+https://github.com/dsymbol/decipher
또는
git clone https://github.com/dsymbol/decipher
cd decipher && pip install .
참고 : 'PIP 설치 해독'을 사용하지 마십시오. 다른 패키지를 설치합니다.
decipher gui
# or
python -m decipher gui
transcribe
Subcommand를 사용하면 비디오 파일을 서브립 자막 (SRT) 파일로 전사 할 수 있습니다. 또한 생성 된 자막을 비디오에 자동으로 추가 할 수있는 옵션도 있습니다.
subtitle
부하 명령을 사용하면 이미 존재하는 SRT 파일을 사용하여 비디오에 자막을 추가 할 수 있습니다. 이 하위 명령은 전사를 수행하지 않고 오히려 SRT 파일이 이미 생성되었다고 가정합니다. 일반적으로 전사 하위 명령에 의해 생성 된 전사의 정확성을 검증하려는 사람들이 사용합니다.
바로 시작하려면 :
decipher --help
스크립트로 실행하는 경우 해독을 패키지로 실행할 수 있습니다.
python -m decipher --help
비디오 용 SRT 자막 생성 :
decipher transcribe -i video.mp4 --model small
화상 생성 된 자막에 비디오에 :
decipher subtitle -i video.mp4 --subtitle_file video.srt --subtitle_action burn
전사를 검증하지 않고 자막을 비디오로 생성하고 연소하십시오.
decipher transcribe -i video.mp4 --model small --subtitle_action burn