YouTube Video Transcript Summarizer with GenAI - YouTube Video Transcript Summarizer with GenAI

YouTube Video Transcript Summarizer with GenAI

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

เครื่องมือสรุปการถอดเสียงวิดีโอ YouTube พร้อม GenAI

การแนะนำ

เครื่องมือสรุปการถอดเสียงวิดีโอ YouTube พร้อม GenAI เป็นเครื่องมือนวัตกรรมที่ออกแบบมาเพื่อประหยัดเวลาโดยการสร้างข้อมูลสรุปที่กระชับโดยอัตโนมัติจากการถอดเสียงวิดีโอ YouTube แอปพลิเคชันนี้ใช้ประโยชน์จาก YouTube Transcript API เพื่อดึงข้อมูลการถอดเสียงวิดีโอ และผสานรวม Gemini AI ของ Google เพื่อสรุป ช่วยให้ผู้ใช้รับประเด็นสำคัญได้อย่างรวดเร็วโดยไม่ต้องดูวิดีโอทั้งหมด ด้วยอินเทอร์เฟซที่สะอาดตาและใช้งานง่ายที่สร้างโดยใช้ Streamlit โปรเจ็กต์นี้ทำให้กระบวนการรับสรุปจากเนื้อหาวิดีโอง่ายขึ้น ทำให้นักเรียน ผู้เชี่ยวชาญ และใครก็ตามที่ต้องการเพิ่มประสิทธิภาพการทำงานสามารถเข้าถึงได้

สารบัญ

เทคโนโลยีและทักษะที่สำคัญ
การติดตั้ง
การใช้งาน
คุณสมบัติ
มีส่วนร่วม
ใบอนุญาต
ติดต่อ

เทคโนโลยีและทักษะที่สำคัญ

หลาม
AI เจนเนอเรชั่นของ Google
API การถอดเสียงของ YouTube
วิศวกรรมพร้อมท์
สตรีมไลท์

การติดตั้ง

ในการรันโปรเจ็กต์นี้ คุณต้องติดตั้งแพ็คเกจต่อไปนี้:

 pip install python - dotenv
pip install streamlit
pip install streamlit - extras
pip install youtube - transcript - api
pip install google - generativeai
pip install langcodes
pip install language_data

การใช้งาน

เมื่อต้องการใช้โครงการนี้ ให้ทำตามขั้นตอนเหล่านี้:

โคลนพื้นที่เก็บข้อมูล: git clone https://github.com/gopiashokan/YouTube-Video-Transcript-Summarizer-with-GenAI.git
ติดตั้งแพ็คเกจที่จำเป็น: pip install -r requirements.txt
เพิ่มคีย์ Google API ของคุณลงในไฟล์ . .env
เรียกใช้แอป Streamlit: streamlit run app.py
เข้าถึงแอปในเบราว์เซอร์ของคุณที่ http://localhost:8501

คุณสมบัติ

การดึงข้อมูลการถอดเสียงวิดีโอ YouTube:

ลิงก์วิดีโออินพุต: ผู้ใช้สามารถระบุลิงก์วิดีโอ YouTube ไปยังแอปพลิเคชันได้อย่างง่ายดาย ระบบจะแยกรหัสวิดีโอออกจาก URL โดยอัตโนมัติและเตรียมคำขอสำหรับการถอดเสียง
การตรวจจับภาษาการถอดเสียง: การใช้ YouTube Transcript API แอปพลิเคชันจะตรวจจับภาษาการถอดเสียงที่มีอยู่ทั้งหมดสำหรับวิดีโอที่ระบุ สิ่งนี้ทำให้แน่ใจได้ว่าผู้ใช้สามารถเลือกภาษาที่ต้องการสำหรับการสรุปได้
การแปลงภาษา: รหัสภาษาที่ตรวจพบจะถูกแปลงเป็นชื่อที่มนุษย์สามารถอ่านได้โดยใช้ไลบรารี Langcodes ช่วยให้ผู้ใช้สามารถระบุและเลือกภาษาในการถอดเสียงที่ต้องการได้อย่างง่ายดาย

การประมวลผลการถอดเสียง:

การเลือกภาษา: เมื่อผู้ใช้เลือกภาษาการถอดเสียงที่ต้องการแล้ว YouTube Transcript API จะดึงข้อมูลการถอดเสียงเป็นภาษานั้น ขั้นตอนนี้ช่วยให้แน่ใจว่าข้อความถอดเสียงได้รับการปรับแต่งให้เหมาะกับภาษาที่ผู้ใช้เลือก เพื่อเตรียมพร้อมสำหรับการประมวลผล AI ที่แม่นยำ
การจัดการการถอดเสียง: แอปพลิเคชันจะประมวลผลและจัดรูปแบบการถอดเสียงที่ดึงมาเพื่อให้แน่ใจว่าตรงตามข้อกำหนดของโมเดล AI ทั่วไป ขั้นตอนนี้เกี่ยวข้องกับการทำความสะอาดและการจัดระเบียบข้อความเพื่อการสรุปที่มีประสิทธิภาพโดย AI

การสรุปที่ขับเคลื่อนโดย AI:

โมเดล AI เจนเนอเรชั่น: โครงการนี้รวมโมเดล Gemini AI gemini-pro ของ Google เพื่อสร้างข้อมูลสรุป โมเดลจะประมวลผลการถอดเสียงวิดีโอพร้อมกับข้อความที่จัดทำขึ้นอย่างพิถีพิถันเพื่อนำเสนอบทสรุปที่กระชับ แม่นยำ และคำนึงถึงบริบท ทำให้ผู้ใช้ไม่จำเป็นต้องดูวิดีโอทั้งหมด
การแจ้งแบบกำหนดเอง: ระบบใช้พรอมต์ที่ออกแบบอย่างชาญฉลาดซึ่งแนะนำ AI ในการสร้างบทสรุปที่เกี่ยวข้อง เพื่อให้มั่นใจว่าประเด็นสำคัญจากวิดีโอจะถูกบันทึกและนำเสนออย่างชัดเจน

แอปพลิเคชันสตรีมไลท์:

ส่วนต่อประสานที่ใช้งานง่าย: แอปพลิเคชันทั้งหมดสร้างขึ้นโดยใช้ Streamlit ซึ่งมีอินเทอร์เฟซที่ราบรื่นและโต้ตอบได้ ช่วยให้มั่นใจได้ว่าผู้ใช้สามารถป้อนลิงก์วิดีโอ เลือกภาษา และดูเนื้อหาสรุปได้อย่างง่ายดาย ทั้งหมดในที่เดียว
การโต้ตอบแบบเรียลไทม์: แอปพลิเคชันนี้ให้ข้อเสนอแนะและผลลัพธ์แบบเรียลไทม์ ทำให้ผู้ใช้สามารถรับวิดีโอสรุปได้เกือบจะในทันที สิ่งนี้ทำให้ประสบการณ์ไม่เพียงแต่มีประสิทธิภาพเท่านั้น แต่ยังตอบสนองต่อการกระทำของผู้ใช้ได้เป็นอย่างดีอีกด้วย