โปรเจ็กต์นี้มีเครื่องมือในการแปลงเอกสาร PDF ให้เป็นตอนของพอดแคสต์! การใช้ Gemini ของ Google ในการสร้างบทสนทนาและโมเดลการอ่านออกเสียงข้อความของ OpenAI เครื่องมือนี้ประมวลผลเนื้อหาของ PDF สร้างบทสนทนาที่เป็นธรรมชาติที่เหมาะสำหรับพอดแคสต์เสียง และส่งออกเป็นไฟล์ MP3
หากต้องการตั้งค่าโครงการ ให้ทำตามขั้นตอนเหล่านี้:
โคลนที่เก็บ:
git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast
ติดตั้งการพึ่งพา:
uv sync
ตั้งค่าคีย์ API:
คุณจะต้องมีคีย์ API สำหรับ OpenAI ซึ่งคุณสามารถส่งผ่านอินเทอร์เฟซหรือตั้งค่าเป็นตัวแปรสภาพแวดล้อม OPENAI_API_KEY
ได้
เรียกใช้แอปพลิเคชัน:
python main.py
นี่จะเป็นการเปิดอินเทอร์เฟซ Gradio ในเว็บเบราว์เซอร์ของคุณ
อัปโหลด PDF: อัปโหลดเอกสาร PDF ที่คุณต้องการแปลงเป็นพอดแคสต์
ป้อนคีย์ OpenAI API: ระบุคีย์ OpenAI API ของคุณในกล่องข้อความที่กำหนด
สร้างเสียง: คลิกปุ่มเพื่อเริ่มกระบวนการแปลง ผลลัพธ์จะเป็นไฟล์ MP3 ที่มีบทสนทนาพอดแคสต์
โครงการนี้ได้รับอนุญาตภายใต้ลิขสิทธิ์ Apache 2.0 ดูไฟล์ใบอนุญาตสำหรับข้อมูลเพิ่มเติม