นี่คือเครื่องมือแปลและพากย์วิดีโอที่สามารถแปลวิดีโอในภาษาเดียวเป็นวิดีโอในภาษาที่ระบุ และสร้างและเพิ่มคำบรรยายและการพากย์ในภาษานั้นโดยอัตโนมัติ และรองรับการเรียก API
การรู้จำเสียงรองรับโมเดลออฟไลน์ท้องถิ่น faster-whisper
และ openai-whisper
และ OpenAI SpeechToText API
GoogleSpeech
阿里中文语音识别模型
และโมเดลถุงถั่ว และรองรับ API การรู้จำเสียงแบบกำหนดเอง
การแปลข้อความรองรับ微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT
เสียงสังเคราะห์ข้อความรองรับ Microsoft Edge tts
Google tts
Azure AI TTS
Openai TTS
Elevenlabs TTS
自定义TTS服务器api
GPT-SoVITS
โคลนเสียง ChatTTS-ui Fish TTS CosyVoice
อนุญาตให้เก็บเพลงประกอบพื้นหลัง ฯลฯ (ขึ้นอยู่กับ uvr5)
ภาษาที่รองรับ: จีนตัวย่อและตัวเต็ม, อังกฤษ, เกาหลี, ญี่ปุ่น, รัสเซีย, ฝรั่งเศส, เยอรมัน, อิตาลี, สเปน, โปรตุเกส, เวียดนาม, ไทย, อาหรับ, ตุรกี, ฮังการี, อินเดีย, ยูเครน, คาซัคสถาน, อินโดนีเซีย, มาเลย์, เช็ก, โปแลนด์, การตรวจจับอัตโนมัติแบบดัตช์, สวีเดน / ภาษาอื่น ๆ
[สปอนเซอร์]
302.AI คือซุปเปอร์มาร์เก็ต AI ที่รวบรวมแบรนด์ชั้นนำของโลกมาไว้ด้วยกัน โดยมาพร้อมการจ่ายตามที่ใช้งาน ไม่มีค่าธรรมเนียมรายเดือน และไม่มีเกณฑ์ขั้นต่ำสำหรับการใช้ AI ประเภทต่างๆ
ฟังก์ชั่นที่ครอบคลุม/ใช้งานง่าย/ไม่มีเกณฑ์การชำระเงินตามความต้องการ/แยกผู้จัดการและผู้ใช้
[แปลวิดีโอและพากย์อัตโนมัติ] แปลเสียงในวิดีโอเป็นภาษาพากย์เป็นภาษาอื่นและฝังคำบรรยายในภาษานั้น
[การรู้จำคำพูด/แปลงเสียงและวิดีโอเป็นคำบรรยาย] สามารถจดจำเสียงของมนุษย์ในไฟล์เสียงและวิดีโอเป็นข้อความเป็นชุดและส่งออกเป็นไฟล์คำบรรยาย srt
[การสังเคราะห์เสียงพูด/การพากย์คำบรรยาย] สร้างการพากย์ตามไฟล์คำบรรยาย srt ที่มีอยู่ในเครื่อง ซึ่งรองรับคำบรรยายเดี่ยวหรือเป็นกลุ่ม
[แปลไฟล์คำบรรยาย] แปลไฟล์คำบรรยาย srt หนึ่งไฟล์ขึ้นไปเป็นไฟล์คำบรรยายในภาษาอื่น
[รวมวิดีโอและเสียง] รวมไฟล์วิดีโอและไฟล์เสียงเป็นชุดในการโต้ตอบแบบตัวต่อตัว
[รวมวิดีโอและคำบรรยาย srt] รวมไฟล์วิดีโอและไฟล์คำบรรยาย srt ทีละชุด
[เพิ่มลายน้ำรูปภาพลงในวิดีโอ] ฝังลายน้ำรูปภาพลงในไฟล์วิดีโอเป็นชุด
【แยกเสียงออกจากวิดีโอ】แยกวิดีโอออกเป็นไฟล์เสียงและวิดีโอเงียบ
[การแปลงรูปแบบเสียงและวิดีโอ] แปลงรูปแบบเสียงและวิดีโอเป็นชุด
[การแก้ไขคำบรรยายและการส่งออกไปยังหลายรูปแบบ] รองรับการนำเข้าคำบรรยายในรูปแบบ srt, vtt และ ass หลังจากแก้ไข คุณสามารถตั้งค่ารูปแบบตัวอักษร สี ฯลฯ เพื่อส่งออกคำบรรยายในรูปแบบที่เกี่ยวข้อง
[การแปลงรูปแบบคำบรรยาย] แปลงไฟล์คำบรรยายเป็นรูปแบบ srt/ass/vtt เป็นกลุ่ม
[ดาวน์โหลดวิดีโอ YouTube] สามารถดาวน์โหลดวิดีโอได้จาก YouTube
[การแยกเพลงพื้นหลังเสียงร้อง]
[การเรียก API] รองรับการสังเคราะห์เสียงพูด การรู้จำภาษา การแปลคำบรรยาย และการเรียกอินเทอร์เฟซการแปลวิดีโอ
ใช้ pyinstaller เพื่อจัดทำแพ็กเกจโดยไม่มีโปรแกรมป้องกันไวรัสและลายเซ็น ซอฟต์แวร์ป้องกันไวรัสอาจรายงานไวรัส โปรดเพิ่มลงในรายการที่เชื่อถือได้หรือใช้ซอร์สโค้ดสำหรับการปรับใช้
[คลิกเพื่อดาวน์โหลดเวอร์ชันบรรจุล่วงหน้า แตกไฟล์ลงในไดเร็กทอรีภาษาอังกฤษโดยไม่มีช่องว่าง และดับเบิลคลิก sp.exe (https://github.com/jianchang512/pyvideotrans/releases)
คลายซิปเป็นเส้นทางภาษาอังกฤษ และเส้นทางไม่มีการเว้นวรรค หลังจากแตกไฟล์แล้ว ให้ดับเบิลคลิก sp.exe (หากคุณประสบปัญหาในการอนุญาต คุณสามารถคลิกขวาและเปิดด้วยสิทธิ์ของผู้ดูแลระบบ)
หมายเหตุ: จะต้องแตกไฟล์ก่อนใช้งาน ไม่สามารถดับเบิลคลิกได้โดยตรงในแพ็คเกจที่บีบอัด และไม่สามารถย้ายไฟล์ sp.exe ไปยังตำแหน่งอื่นหลังจากคลายการบีบอัด
เปิดหน้าต่างเทอร์มินัลและดำเนินการคำสั่งต่อไปนี้ตามลำดับ:
ตรวจสอบให้แน่ใจว่าได้ติดตั้ง Homebrew ก่อนดำเนินการ หากคุณไม่ได้ติดตั้ง Homebrew คุณต้องติดตั้งก่อน
ดำเนินการคำสั่งเพื่อติดตั้ง Homebrew:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
หลังจากการติดตั้งเสร็จสมบูรณ์ ให้ดำเนินการ:
eval $(brew --config)
brew install libsndfile brew install ffmpeg brew install git brew install [email protected]
ดำเนินการต่อไป
export PATH="/usr/local/opt/[email protected]/bin:$PATH" source ~/.bash_profile source ~/.zshrc
สร้างโฟลเดอร์ที่ไม่มีช่องว่างและตัวอักษรจีน และป้อนโฟลเดอร์ในเทอร์มินัล
ดำเนินการคำสั่ง git clone https://github.com/jianchang512/pyvideotrans
ในเทอร์มินัล
ดำเนินการคำสั่ง cd pyvideotrans
ดำเนินการ python -m venv venv
ต่อไป
ดำเนินการคำสั่ง source ./venv/bin/activate
ต่อไป หลังจากดำเนินการแล้ว ให้ตรวจสอบและยืนยันว่าพรอมต์คำสั่งเทอร์มินัลเปลี่ยนไปเริ่มต้นด้วย (venv)
คำสั่งต่อไปนี้ต้องแน่ใจว่าพรอมต์เทอร์มินัลเริ่มต้นด้วย (venv)
ดำเนินการ pip install -r requirements.txt
หากข้อความแจ้งล้มเหลว ให้ดำเนินการ 2 คำสั่งต่อไปนี้เพื่อเปลี่ยนอิมเมจ pip เป็นอิมเมจของ Alibaba
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
จากนั้นดำเนินการใหม่ หากคุณเปลี่ยนไปใช้แหล่งรูปภาพของ Alibaba แล้ว แต่ก็ยังล้มเหลว โปรดลองดำเนินการ pip install -r requirements.txt
python sp.py
เปิดอินเทอร์เฟซซอฟต์แวร์
ระบบ CentOS/RHEL รันคำสั่งต่อไปนี้เพื่อติดตั้ง python3.10
sudo yum update sudo yum groupinstall "Development Tools" sudo yum install openssl-devel bzip2-devel libffi-devel cd /tmp wget https://www.python.org/ftp/python/3.10.4/Python-3.10.4.tgz tar xzf Python-3.10.4.tgz cd Python-3.10.4 ./configure — enable-optimizations sudo make && sudo make install sudo alternatives — install /usr/bin/python3 python3 /usr/local/bin/python3.10 1 sudo yum install -y ffmpeg
สำหรับระบบ Ubuntu/Debian ให้รันคำสั่งต่อไปนี้เพื่อติดตั้ง python3.10
apt update && apt upgrade -y apt install software-properties-common -y add-apt-repository ppa:deadsnakes/ppa apt update sudo apt-get install libxcb-cursor0 apt install python3.10 curl -sS https://bootstrap.pypa.io/get-pip.py | python3.10 sudo update-alternatives --install /usr/bin/python python /usr/local/bin/python3.10 1 sudo update-alternatives --config python apt-get install ffmpeg
เปิดเทอร์มินัลใด ๆ และดำเนินการ python3 -V
หากแสดง "3.10.4" แสดงว่าการติดตั้งสำเร็จ ไม่เช่นนั้นจะล้มเหลว
สร้างโฟลเดอร์ที่ไม่มีช่องว่างและตัวอักษรจีน และเปิดโฟลเดอร์จากเทอร์มินัล
ดำเนินการคำสั่ง git clone https://github.com/jianchang512/pyvideotrans
ในเทอร์มินัล
ดำเนินการคำสั่ง cd pyvideotrans
ต่อไป
ดำเนินการ python -m venv venv
ต่อไป
ดำเนินการคำสั่ง source ./venv/bin/activate
ต่อไป หลังจากดำเนินการแล้ว ให้ตรวจสอบและยืนยันว่าพรอมต์คำสั่งเทอร์มินัลเปลี่ยนไปเริ่มต้นด้วย (venv)
คำสั่งต่อไปนี้ต้องแน่ใจว่าพรอมต์เทอร์มินัลเริ่มต้นด้วย (venv)
ดำเนินการ pip install -r requirements.txt
หากข้อความแจ้งล้มเหลว ให้ดำเนินการ 2 คำสั่งต่อไปนี้เพื่อเปลี่ยนอิมเมจ pip เป็นอิมเมจของ Alibaba
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
จากนั้นดำเนินการใหม่ หากคุณเปลี่ยนไปใช้แหล่งอิมเมจของ Alibaba แล้วยังคงล้มเหลว โปรดลอง pip install -r requirements.txt
หากคุณต้องการใช้การเร่งความเร็ว CUDA ให้ดำเนินการแยกกัน
pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
pip install nvidia-cublas-cu11 nvidia-cudnn-cu11
linux หากคุณต้องการเปิดใช้งานการเร่งความเร็ว cuda คุณต้องมีการ์ดกราฟิก NVIDIA และกำหนดค่าสภาพแวดล้อม CUDA11.8+ โปรดค้นหา "การติดตั้ง Linux CUDA"
python sp.py
เปิดอินเทอร์เฟซซอฟต์แวร์
เปิด https://www.python.org/downloads/ เพื่อดาวน์โหลด windows 3.10 หลังจากดาวน์โหลด ให้ดับเบิลคลิกแล้วคลิกถัดไป
เปิด cmd และดำเนินการ python -V
หากเอาต์พุตไม่ใช่ 3.10.4
แสดงว่าเกิดข้อผิดพลาดในการติดตั้งหรือไม่ได้เพิ่ม Add to PATH
ใหม่
เปิด https://github.com/git-for-windows/git/releases/download/v2.45.0.windows.1/Git-2.45.0-64-bit.exe ดาวน์โหลด git และดับเบิลคลิกถัดไป ขั้นตอนหลังจากดาวน์โหลด
ค้นหาโฟลเดอร์ที่ไม่มีช่องว่างและตัวอักษรจีน ป้อน cmd
ในแถบที่อยู่แล้วกด Enter เปิดเทอร์มินัล และดำเนินการคำสั่งต่อไปนี้ในเทอร์มินัล
ดำเนินการคำสั่ง git clone https://github.com/jianchang512/pyvideotrans
ดำเนินการคำสั่ง cd pyvideotrans
ต่อไป
ดำเนินการ python -m venv venv
ต่อไป
ดำเนินการคำสั่ง . .venvscriptsactivate
ต่อไป หลังจากดำเนินการแล้ว โปรดตรวจสอบเพื่อยืนยันว่าจุดเริ่มต้นของบรรทัดคำสั่งเปลี่ยนเป็น (venv)
มิฉะนั้นจะเกิดข้อผิดพลาด
ดำเนินการ pip install -r requirements.txt
หากข้อความแจ้งล้มเหลว ให้ดำเนินการ 2 คำสั่งต่อไปนี้เพื่อเปลี่ยนอิมเมจ pip เป็นอิมเมจของ Alibaba
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
จากนั้นดำเนินการใหม่ หากคุณเปลี่ยนไปใช้แหล่งอิมเมจของ Alibaba แล้วยังคงล้มเหลว โปรดลอง pip install -r requirements.txt
หากคุณต้องการใช้การเร่งความเร็ว CUDA ให้ดำเนินการแยกกัน
pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
Windows หากคุณต้องการเปิดใช้งานการเร่งความเร็ว CUDA คุณต้องมีการ์ดกราฟิก NVIDIA และกำหนดค่าสภาพแวดล้อม CUDA11.8+ สำหรับการติดตั้งเฉพาะ โปรดดู การสนับสนุนการเร่งความเร็ว CUDA
คลายซิป ffmpeg.zip ไปยังไดเร็กทอรีซอร์สโค้ดปัจจุบัน หากได้รับแจ้งให้เขียนทับ ให้เขียนทับ หลังจากคลายการบีบอัด ตรวจสอบให้แน่ใจว่า ffmpeg.exe ffprobe.exe ytwin32.exe สามารถมองเห็นได้ในโฟลเดอร์ ffmepg ใต้ซอร์สโค้ด
python sp.py
เปิดอินเทอร์เฟซซอฟต์แวร์
ctranslate2 เวอร์ชัน 4.x ถูกใช้เป็นค่าเริ่มต้น และรองรับเฉพาะเวอร์ชัน CUDA12.x เท่านั้น หาก cuda ของคุณต่ำกว่า 12 และไม่สามารถอัปเกรด cuda เป็น 12.x ได้ โปรดดำเนินการคำสั่งเพื่อถอนการติดตั้ง ctranslate2 แล้วติดตั้งใหม่
pip uninstall -y ctranslate2 pip install ctranslate2==3.24.0
คุณอาจพบข้อผิดพลาด เช่น xx module not found
โปรดเปิดข้อกำหนด txt ค้นหาโมดูล xx จากนั้นลบ == หลัง xx และหมายเลขเวอร์ชันหลังจากนั้นสักครู่
การปรับใช้ซอร์สโค้ด/สถานี b ภายใต้ Mac
วิธีตั้งค่าการแปลวิดีโอโดยใช้ Gemini Api/station b
วิธีดาวน์โหลดและติดตั้ง
ChatTTS-ui: อินเทอร์เฟซ UI ที่ใช้ ChatTTS เพื่อสังเคราะห์เสียง
OTT: เครื่องมือแปลข้อความออฟไลน์ในเครื่อง
เครื่องมือโคลนเสียง: สังเคราะห์เสียงพูดด้วยเสียงต่างๆ
เครื่องมือรู้จำเสียง: การรู้จำเสียงพูดออฟไลน์ในเครื่องไปยังเครื่องมือข้อความ
การแยกเพลงพื้นหลังแกนนำ: เครื่องมือแยกเสียงร้องและเพลงพื้นหลัง
เวอร์ชันปรับปรุงของ api.py ของ GPT-SoVITS
api.py ปรับให้เข้ากับ CosyVoice
โปรเจ็กต์โอเพ่นซอร์สบางโปรเจ็กต์ที่โปรแกรมนี้ใช้เป็นหลัก
ffmpeg
ไพไซด์6
ขอบ-tts
เร็วขึ้นกระซิบ
openai-กระซิบ
พิดับ