openai_whisper_transcribe_yt_videos ดาวน์โหลด - openai_whisper_transcribe_yt

openai_whisper_transcribe_yt_videos

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

โปรแกรมถอดเสียงวิดีโอ YouTube

โปรเจ็กต์นี้เป็นแอปพลิเคชันที่ใช้ Streamlit ซึ่งอนุญาตให้ผู้ใช้ดาวน์โหลดเสียงจากวิดีโอ YouTube ถอดเสียงโดยใช้โมเดล Whisper ของ OpenAI และแสดงการถอดเสียงด้วยการแบ่งหน้า

คุณสมบัติ

ดาวน์โหลดเสียงจากวิดีโอ YouTube
ถอดเสียงโดยใช้โมเดล Whisper ของ OpenAI
แสดงการถอดเสียงด้วยการแบ่งหน้า
ฆ่าเชื้อชื่อไฟล์เพื่อความเข้ากันได้
รองรับการเร่งความเร็ว CUDA (ถ้ามี)

สาธิต

ดูการสาธิตแอปพลิเคชัน: OpenAI Whisper Transcribe YouTube Videos

ความต้องการ

ไพธอน 3.9+
ไพทอร์ช
yt-dlp
กระซิบ
ติ๊กต๊อก
สตรีมไลท์
FFmpeg (สำหรับการแปลงเสียง)

การติดตั้ง

โคลนที่เก็บนี้:

 git clone https://github.com/RiteshGenAI/openai_whisper_transcribe_yt_videos.git
cd openai_whisper_transcribe_yt_videos

ติดตั้งแพ็คเกจที่จำเป็น:
```
 pip install -r requirements.txt
```
ติดตั้ง FFmpeg หากยังไม่มีอยู่ในระบบของคุณ วิธีการติดตั้งจะแตกต่างกันไปตามระบบปฏิบัติการ

การใช้งาน

เรียกใช้แอป Streamlit:
```
 streamlit run .srcapp.py
```
ป้อน URL วิดีโอ YouTube ในช่องป้อนข้อมูลที่ให้ไว้
แอปจะดาวน์โหลดไฟล์เสียง ถอดเสียง และแสดงการถอดเสียงพร้อมการแบ่งหน้า

มันทำงานอย่างไร

ดาวน์โหลดเสียง : ฟังก์ชัน download_audio ใช้ yt-dlp เพื่อดาวน์โหลดเสียงจาก URL ของ YouTube ที่ให้มา มันจะบันทึกเสียงเป็นไฟล์ WAV
ถอดเสียง : ฟังก์ชัน transcribe_audio ใช้โมเดล Whisper ของ OpenAI เพื่อถอดเสียงไฟล์เสียงที่ดาวน์โหลด
Display Transcript : ฟังก์ชัน display_transcript_with_pagination จะแบ่งการถอดเสียงออกเป็นหน้าต่างๆ และแสดงโดยใช้ส่วนประกอบ UI ของ Streamlit
ประมวลผลเสียง : ฟังก์ชัน process_audio ควบคุมกระบวนการทั้งหมด ตั้งแต่การดาวน์โหลดไปจนถึงการถอดเสียงและแสดงผลลัพธ์

การปรับแต่ง

คุณสามารถเปลี่ยนขนาดโมเดล Whisper ได้โดยการแก้ไขพารามิเตอร์ model_name ในฟังก์ชัน transcribe_audio
ปรับพารามิเตอร์ tokens_per_page ใน display_transcript_with_pagination เพื่อเปลี่ยนจำนวนข้อความที่แสดงต่อหน้า