การแนะนำ
เครื่องมือสรุปการถอดเสียงวิดีโอ YouTube พร้อม GenAI เป็นเครื่องมือนวัตกรรมที่ออกแบบมาเพื่อประหยัดเวลาโดยการสร้างข้อมูลสรุปที่กระชับโดยอัตโนมัติจากการถอดเสียงวิดีโอ YouTube แอปพลิเคชันนี้ใช้ประโยชน์จาก YouTube Transcript API เพื่อดึงข้อมูลการถอดเสียงวิดีโอ และผสานรวม Gemini AI ของ Google เพื่อสรุป ช่วยให้ผู้ใช้รับประเด็นสำคัญได้อย่างรวดเร็วโดยไม่ต้องดูวิดีโอทั้งหมด ด้วยอินเทอร์เฟซที่สะอาดตาและใช้งานง่ายที่สร้างโดยใช้ Streamlit โปรเจ็กต์นี้ทำให้กระบวนการรับสรุปจากเนื้อหาวิดีโอง่ายขึ้น ทำให้นักเรียน ผู้เชี่ยวชาญ และใครก็ตามที่ต้องการเพิ่มประสิทธิภาพการทำงานสามารถเข้าถึงได้
สารบัญ
เทคโนโลยีและทักษะที่สำคัญ
การติดตั้ง
ในการรันโปรเจ็กต์นี้ คุณต้องติดตั้งแพ็คเกจต่อไปนี้:
pip install python - dotenv
pip install streamlit
pip install streamlit - extras
pip install youtube - transcript - api
pip install google - generativeai
pip install langcodes
pip install language_data
การใช้งาน
เมื่อต้องการใช้โครงการนี้ ให้ทำตามขั้นตอนเหล่านี้:
git clone https://github.com/gopiashokan/YouTube-Video-Transcript-Summarizer-with-GenAI.git
pip install -r requirements.txt
.env
streamlit run app.py
http://localhost:8501
คุณสมบัติ
ลิงก์วิดีโออินพุต: ผู้ใช้สามารถระบุลิงก์วิดีโอ YouTube ไปยังแอปพลิเคชันได้อย่างง่ายดาย ระบบจะแยกรหัสวิดีโอออกจาก URL โดยอัตโนมัติและเตรียมคำขอสำหรับการถอดเสียง
การตรวจจับภาษาการถอดเสียง: การใช้ YouTube Transcript API
แอปพลิเคชันจะตรวจจับภาษาการถอดเสียงที่มีอยู่ทั้งหมดสำหรับวิดีโอที่ระบุ สิ่งนี้ทำให้แน่ใจได้ว่าผู้ใช้สามารถเลือกภาษาที่ต้องการสำหรับการสรุปได้
การแปลงภาษา: รหัสภาษาที่ตรวจพบจะถูกแปลงเป็นชื่อที่มนุษย์สามารถอ่านได้โดยใช้ไลบรารี Langcodes
ช่วยให้ผู้ใช้สามารถระบุและเลือกภาษาในการถอดเสียงที่ต้องการได้อย่างง่ายดาย
การเลือกภาษา: เมื่อผู้ใช้เลือกภาษาการถอดเสียงที่ต้องการแล้ว YouTube Transcript API จะดึงข้อมูลการถอดเสียงเป็นภาษานั้น ขั้นตอนนี้ช่วยให้แน่ใจว่าข้อความถอดเสียงได้รับการปรับแต่งให้เหมาะกับภาษาที่ผู้ใช้เลือก เพื่อเตรียมพร้อมสำหรับการประมวลผล AI ที่แม่นยำ
การจัดการการถอดเสียง: แอปพลิเคชันจะประมวลผลและจัดรูปแบบการถอดเสียงที่ดึงมาเพื่อให้แน่ใจว่าตรงตามข้อกำหนดของโมเดล AI ทั่วไป ขั้นตอนนี้เกี่ยวข้องกับการทำความสะอาดและการจัดระเบียบข้อความเพื่อการสรุปที่มีประสิทธิภาพโดย AI
โมเดล AI เจนเนอเรชั่น: โครงการนี้รวมโมเดล Gemini AI gemini-pro
ของ Google เพื่อสร้างข้อมูลสรุป โมเดลจะประมวลผลการถอดเสียงวิดีโอพร้อมกับข้อความที่จัดทำขึ้นอย่างพิถีพิถันเพื่อนำเสนอบทสรุปที่กระชับ แม่นยำ และคำนึงถึงบริบท ทำให้ผู้ใช้ไม่จำเป็นต้องดูวิดีโอทั้งหมด
การแจ้งแบบกำหนดเอง: ระบบใช้พรอมต์ที่ออกแบบอย่างชาญฉลาดซึ่งแนะนำ AI ในการสร้างบทสรุปที่เกี่ยวข้อง เพื่อให้มั่นใจว่าประเด็นสำคัญจากวิดีโอจะถูกบันทึกและนำเสนออย่างชัดเจน
ส่วนต่อประสานที่ใช้งานง่าย: แอปพลิเคชันทั้งหมดสร้างขึ้นโดยใช้ Streamlit ซึ่งมีอินเทอร์เฟซที่ราบรื่นและโต้ตอบได้ ช่วยให้มั่นใจได้ว่าผู้ใช้สามารถป้อนลิงก์วิดีโอ เลือกภาษา และดูเนื้อหาสรุปได้อย่างง่ายดาย ทั้งหมดในที่เดียว
การโต้ตอบแบบเรียลไทม์: แอปพลิเคชันนี้ให้ข้อเสนอแนะและผลลัพธ์แบบเรียลไทม์ ทำให้ผู้ใช้สามารถรับวิดีโอสรุปได้เกือบจะในทันที สิ่งนี้ทำให้ประสบการณ์ไม่เพียงแต่มีประสิทธิภาพเท่านั้น แต่ยังตอบสนองต่อการกระทำของผู้ใช้ได้เป็นอย่างดีอีกด้วย
มีส่วนร่วม
ยินดีมีส่วนร่วมในโครงการนี้! หากคุณพบปัญหาใด ๆ หรือมีข้อเสนอแนะสำหรับการปรับปรุง โปรดอย่าลังเลที่จะส่งคำขอดึง
ใบอนุญาต
โครงการนี้ได้รับอนุญาตภายใต้ใบอนุญาต MIT โปรดตรวจสอบไฟล์ LICENSE เพื่อดูรายละเอียดเพิ่มเติม
ติดต่อ
- อีเมล์: [email protected]
LinkedIn: linkedin.com/in/gopiashokan
หากมีคำถามหรือข้อสงสัยเพิ่มเติม โปรดติดต่อ เรายินดีที่จะช่วยเหลือคุณในทุกข้อสงสัย