Executables แบบสแตนด์อโลนของ Whisper & WHISPER ที่เร็วขึ้นสำหรับผู้ที่ไม่ต้องการกังวลกับ Python
Executables ที่เร็วขึ้น คือ X86-64 ที่เข้ากันได้กับ Windows 7, Linux V5.4, MacOS V10.15 ขึ้นไป
Executables ที่เร็วขึ้น-Whisper-XXL นั้นเข้ากันได้กับ X86-64 กับ Windows 7, Linux V5.4 ขึ้นไป
Executables Whisper นั้นเข้ากันได้กับ x86-64 กับ Windows 7 ขึ้นไป
หมายถึงการใช้ในอินเทอร์เฟซบรรทัดคำสั่งหรือในโปรแกรมเช่นการแก้ไขคำบรรยาย, Tero Subtitler, Ffastrans, Aviutl
เร็วขึ้น-เร็วกว่ามากและดีกว่าเสียงกระซิบของ Openai และต้องใช้ Ram/Vram น้อยกว่า
faster-whisper-xxl.exe "D:videofile.mkv" --language English --model medium --output_dir source
faster-whisper-xxl.exe "D:Folder" -l en -m turbo --sentence --batch_recursive
faster-whisper-xxl.exe "D:videofile.mkv" -l ja -m medium --task translate --standard -o source
faster-whisper-xxl.exe --help
Executables & Libs สามารถดาวน์โหลดได้จาก Releases
[ทางด้านขวาของหน้านี้]
อย่าคัดลอกโปรแกรมไปยังโฟลเดอร์ของ Windows! [เรียกใช้เป็นผู้ดูแลระบบถ้าคุณทำ]
โปรแกรมโดยอัตโนมัติจะเลือกทำงานกับ GPU หากตรวจพบ CUDA
สำหรับการถอดความที่ดีใช้ไม่น้อยกว่ารุ่น medium
คำแนะนำวิธีเรียกใช้โปรแกรมบรรทัดคำสั่ง: https://www.youtube.com/watch?v=A3NWRCV-BTU
Vanilla Whisper รวบรวมไว้ - ไม่มีการเปลี่ยนแปลงรหัสต้นฉบับ
การใช้งานอ้างอิงการพัฒนาที่นิ่ง, ATM อาจมีประโยชน์สำหรับการทดสอบบางอย่าง
ค่าเริ่มต้นบางอย่างจะถูกปรับแต่งสำหรับการถอดความภาพยนตร์และเพื่อให้พกพาได้
มีการตั้งค่าการทดลองใหม่ ๆ และการปรับแต่ง
แสดงแถบความคืบหน้าในแถบชื่อเรื่องของอินเทอร์เฟซบรรทัดคำสั่ง [หรือสามารถพิมพ์ได้ด้วย -pp
]
โดยค่าเริ่มต้นมันจะมองหาโมเดลในโฟลเดอร์เดียวกันในเส้นทางเช่นนี้-> _modelsfaster-whisper-medium
รุ่นจะถูกดาวน์โหลดโดยอัตโนมัติหรือสามารถดาวน์โหลดได้ด้วยตนเองจาก: Systran & Purfview
เลิกใช้แล้ว ใช้ whisper-xxl เร็วขึ้น
รวมคุณสมบัติที่เร็วขึ้นแบบสแตนด์อโลนทั้งหมด + ตัวอย่างเพิ่มเติมเช่น:
เสียงล่วงหน้าด้วย MDX23 KIM_VOCAL_V2 โมเดลการสกัดเสียงร้อง
วิธี VAD ทางเลือก: 'Silero_v3', 'Silero_v4', 'Pyannote_v3', 'Pyannote_onnx_v3', 'Auditok', 'Webrtc'
ลำโพง diarization
อ่านเพิ่มเติมเกี่ยวกับคุณสมบัติใหม่ในเธรดการสนทนา