한 언어의 영상을 특정 언어의 영상으로 번역하고, 해당 언어의 자막과 더빙을 자동으로 생성 및 추가할 수 있는 영상 번역 및 더빙 도구입니다. API 호출을 지원합니다.
음성 인식은 faster-whisper
및 openai-whisper
로컬 오프라인 모델과 OpenAI SpeechToText API
GoogleSpeech
阿里中文语音识别模型
및 빈백 모델을 지원하고 사용자 정의 음성 인식 API를 지원합니다.
텍스트 번역은微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT
지원합니다.
텍스트 합성 음성 지원 Microsoft Edge tts
Google tts
Azure AI TTS
Openai TTS
Elevenlabs TTS
自定义TTS服务器api
GPT-SoVITS
clone-voice ChatTTS-ui Fish TTS CosyVoice
배경 반주 음악 등을 유지할 수 있습니다. (uvr5 기준)
지원되는 언어: 중국어 간체 및 번체, 영어, 한국어, 일본어, 러시아어, 프랑스어, 독일어, 이탈리아어, 스페인어, 포르투갈어, 베트남어, 태국어, 아랍어, 터키어, 헝가리어, 인도어, 우크라이나어, 카자흐어, 인도네시아어, 말레이어, 체코어, 폴란드어, 네덜란드어, 스웨덴어/기타 언어 선택 자동 감지
[스폰서]
302.AI는 종량제, 월 수수료 0, 다양한 유형의 AI 사용에 대한 임계값이 없는 세계 최고의 브랜드를 하나로 모은 AI 슈퍼마켓입니다.
다양한 기능/사용하기 쉬움/온디맨드 결제 기준점 제로/관리자와 사용자 분리
[동영상 및 더빙 자동 번역] 영상 속 소리를 다른 언어로 더빙하여 번역하고 해당 언어의 자막을 삽입합니다.
[음성인식/오디오,비디오를 자막으로 변환] 오디오,비디오 파일에 포함된 사람의 음성을 텍스트로 일괄 인식하여 srt자막 파일로 내보낼 수 있습니다.
[음성합성/자막 더빙] 기존 로컬 srt 자막 파일을 기반으로 더빙 생성, 단일 또는 일괄 자막 지원
[자막 파일 번역] 하나 이상의 srt 자막 파일을 다른 언어의 자막 파일로 번역합니다.
[비디오와 오디오 병합] 비디오 파일과 오디오 파일을 일대일 대응으로 일괄 병합
[영상과 srt 자막 병합] 영상 파일과 srt 자막 파일을 하나씩 일괄 병합
[동영상에 이미지 워터마크 추가] 동영상 파일에 이미지 워터마크를 일괄 삽입합니다.
【비디오에서 오디오 추출】비디오를 오디오 파일과 무음 비디오로 분리
[오디오 및 비디오 형식 변환] 오디오 및 비디오 형식을 일괄 변환
[자막 편집 및 다양한 형식으로 내보내기] srt, vtt, ass 형식의 자막 가져오기를 지원합니다. 편집 후 글꼴 스타일, 색상 등을 설정하여 해당 형식으로 자막을 내보낼 수 있습니다.
[자막 형식 변환] 자막 파일을 srt/ass/vtt 형식으로 일괄 변환합니다.
[YouTube 동영상 다운로드] YouTube에서 동영상을 다운로드할 수 있습니다.
[보컬 배경음악 분리]
[API 호출] 음성합성, 언어인식, 자막번역, 영상번역 인터페이스 호출 지원
바이러스 백신 및 서명 없이 패키지하려면 pyinstaller를 사용하십시오. 바이러스 백신 소프트웨어를 신뢰 목록에 추가하거나 배포용 소스 코드를 사용하십시오.
[클릭하여 사전 패키지 버전을 다운로드하고 공백 없이 영문 디렉터리에 압축을 푼 후 sp.exe를 두 번 클릭합니다(https://github.com/jianchang512/pyvideotrans/releases)
영문 경로에 압축을 풀어주시고 공백이 없는 경로로 해주세요. 압축을 푼 후 sp.exe를 두 번 클릭합니다. (권한 문제가 발생할 경우 마우스 오른쪽 버튼을 클릭하여 관리자 권한으로 열 수 있습니다.)
참고: 사용하기 전에 압축을 풀어야 합니다. 압축된 패키지에서는 직접 두 번 클릭할 수 없으며 압축 해제 후 sp.exe 파일을 다른 위치로 이동할 수 없습니다.
터미널 창을 열고 각각 다음 명령을 실행합니다.
실행하기 전에 Homebrew가 설치되어 있는지 확인하세요. Homebrew가 설치되어 있지 않은 경우 먼저 설치해야 합니다.
Homebrew를 설치하려면 다음 명령을 실행하십시오.
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
설치가 완료되면 다음을 실행합니다:
eval $(brew --config)
brew install libsndfile brew install ffmpeg brew install git brew install [email protected]
계속 실행
export PATH="/usr/local/opt/[email protected]/bin:$PATH" source ~/.bash_profile source ~/.zshrc
공백과 한자가 없는 폴더를 생성하고 해당 폴더를 터미널에 입력합니다.
터미널에서 git clone https://github.com/jianchang512/pyvideotrans
명령을 실행합니다.
cd pyvideotrans
명령을 실행하십시오.
python -m venv venv
계속 실행합니다.
source ./venv/bin/activate
명령을 계속 실행합니다. 실행 후 터미널 명령 프롬프트가 (venv)
로 시작되도록 변경되었는지 확인합니다. 다음 명령은 터미널 프롬프트가 (venv)
로 시작하는지 확인해야 합니다.
pip install -r requirements.txt
실행하세요. 프롬프트가 실패하면 다음 2개의 명령을 실행하여 pip 이미지를 Alibaba 이미지로 전환하세요.
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
그런 다음 다시 실행하십시오. Alibaba 이미지 소스로 전환했는데 여전히 실패하는 경우 pip install -r requirements.txt
실행해 보십시오.
python sp.py
소프트웨어 인터페이스를 엽니다.
CentOS/RHEL 시스템은 python3.10을 설치하기 위해 다음 명령을 실행합니다.
sudo yum update sudo yum groupinstall "Development Tools" sudo yum install openssl-devel bzip2-devel libffi-devel cd /tmp wget https://www.python.org/ftp/python/3.10.4/Python-3.10.4.tgz tar xzf Python-3.10.4.tgz cd Python-3.10.4 ./configure — enable-optimizations sudo make && sudo make install sudo alternatives — install /usr/bin/python3 python3 /usr/local/bin/python3.10 1 sudo yum install -y ffmpeg
Ubuntu/Debian 시스템의 경우 다음 명령을 실행하여 python3.10을 설치합니다.
apt update && apt upgrade -y apt install software-properties-common -y add-apt-repository ppa:deadsnakes/ppa apt update sudo apt-get install libxcb-cursor0 apt install python3.10 curl -sS https://bootstrap.pypa.io/get-pip.py | python3.10 sudo update-alternatives --install /usr/bin/python python /usr/local/bin/python3.10 1 sudo update-alternatives --config python apt-get install ffmpeg
터미널을 열고 python3 -V
실행합니다. "3.10.4"가 표시되면 설치가 성공한 것이고, 그렇지 않으면 실패합니다.
공백과 한자가 없는 폴더를 생성하고 터미널에서 폴더를 엽니다.
터미널에서 git clone https://github.com/jianchang512/pyvideotrans
명령을 실행합니다.
cd pyvideotrans
명령을 계속 실행하십시오.
python -m venv venv
계속 실행합니다.
source ./venv/bin/activate
명령을 계속 실행합니다. 실행 후 터미널 명령 프롬프트가 (venv)
로 시작되도록 변경되었는지 확인합니다. 다음 명령은 터미널 프롬프트가 (venv)
로 시작하는지 확인해야 합니다.
pip install -r requirements.txt
실행하세요. 프롬프트가 실패하면 다음 2개의 명령을 실행하여 pip 이미지를 Alibaba 이미지로 전환하세요.
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
그런 다음 다시 실행하십시오. Alibaba 이미지 소스로 전환했는데 여전히 실패하는 경우 pip install -r requirements.txt
시도하십시오.
CUDA 가속을 사용하려면 별도로 실행하세요.
pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
pip install nvidia-cublas-cu11 nvidia-cudnn-cu11
linux cuda 가속을 활성화하려면 NVIDIA 그래픽 카드가 있어야 하며 CUDA11.8+ 환경을 구성해야 합니다. "Linux CUDA 설치"를 검색하세요.
python sp.py
소프트웨어 인터페이스를 엽니다.
https://www.python.org/downloads/를 열어 Windows 3.10을 다운로드한 후 두 번 클릭하고 "PATH에 추가"를 선택하세요.
cmd를 열고 python -V
실행하세요. 출력이 3.10.4
아니면 설치 오류가 있거나 Add to PATH
추가되지 않았음을 의미합니다.
https://github.com/git-for-windows/git/releases/download/v2.45.0.windows.1/Git-2.45.0-64-bit.exe를 열고 git을 다운로드한 후 다음을 두 번 클릭합니다. 다운로드 후 단계.
공백과 한자가 없는 폴더를 찾아 주소창에 cmd
입력 후 엔터키를 눌러 터미널을 열고 터미널에서 다음 명령어를 실행합니다.
git clone https://github.com/jianchang512/pyvideotrans
명령을 실행합니다.
cd pyvideotrans
명령을 계속 실행하십시오.
python -m venv venv
계속 실행합니다.
.venvscriptsactivate
명령을 계속 실행하세요. 실행 후 명령줄의 시작 부분이 (venv)
로 변경되었는지 확인하세요. 그렇지 않으면 오류가 발생한 것입니다.
pip install -r requirements.txt
실행하세요. 프롬프트가 실패하면 다음 2개의 명령을 실행하여 pip 이미지를 Alibaba 이미지로 전환하세요.
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
그런 다음 다시 실행하십시오. Alibaba 이미지 소스로 전환했는데 여전히 실패하는 경우 pip install -r requirements.txt
시도하십시오.
CUDA 가속을 사용하려면 별도로 실행하세요.
pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
Windows CUDA 가속을 활성화하려면 NVIDIA 그래픽 카드가 있어야 하며 CUDA11.8+ 환경을 구성해야 합니다. 특정 설치에 대해서는 CUDA 가속 지원을 참조하세요.
ffmpeg.zip을 현재 소스 코드 디렉터리에 압축 해제합니다. 덮어쓰라는 메시지가 나타나면 덮어씁니다. 압축을 푼 후 소스 코드 아래의 ffmepg 폴더에 ffmpeg.exe ffprobe.exe ytwin32.exe가 보이는지 확인하세요.
python sp.py
소프트웨어 인터페이스를 엽니다.
ctranslate2의 4.x 버전은 기본적으로 사용되며 CUDA12.x 버전만 지원합니다. cuda가 12보다 낮고 cuda를 12.x로 업그레이드할 수 없는 경우 명령을 실행하여 ctranslate2를 제거한 다음 다시 설치하십시오.
pip uninstall -y ctranslate2 pip install ctranslate2==3.24.0
xx module not found
. 와 같은 오류가 발생할 수 있습니다. 요구사항.txt를 열고 xx 모듈을 검색한 후 잠시 후 xx 뒤에 있는 ==와 버전 번호를 제거하세요.
Mac에서 소스 코드 배포/B 스테이션
Gemini Api/station b를 사용하여 비디오 번역을 설정하는 방법
다운로드 및 설치 방법
ChatTTS-ui: ChatTTS를 사용하여 사운드를 합성하는 UI 인터페이스
OTT: 로컬 오프라인 텍스트 번역 도구
음성 복제 도구: 모든 음색으로 음성을 합성합니다.
음성 인식 도구: 텍스트 도구에 대한 로컬 오프라인 음성 인식
보컬 배경음악 분리 : 보컬과 배경음악 분리 도구
GPT-SoVITS의 api.py 개선 버전
CosyVoice에 맞게 조정된 api.py
이 프로그램이 주로 의존하는 일부 오픈 소스 프로젝트
ffmpeg
파이사이드6
가장자리-tts
더 빠른 속삭임
공개 속삭임
피덥