Proyek ini menyediakan alat untuk mengubah dokumen PDF apa pun menjadi episode podcast! Menggunakan Gemini Google untuk pembuatan dialog dan model text-to-speech OpenAI, alat ini memproses konten PDF, menghasilkan dialog alami yang cocok untuk podcast audio, dan mengeluarkannya sebagai file MP3.
Untuk menyiapkan proyek, ikuti langkah-langkah berikut:
Kloning repositori:
git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast
Instal dependensi:
uv sync
Siapkan Kunci API:
Anda memerlukan kunci api untuk OpenAI yang dapat Anda lewati melalui antarmuka atau ditetapkan sebagai variabel lingkungan OPENAI_API_KEY
.
Jalankan aplikasi:
python main.py
Ini akan meluncurkan antarmuka Gradio di browser web Anda.
Unggah PDF: Unggah dokumen PDF yang ingin Anda ubah menjadi podcast.
Masukkan Kunci API OpenAI: Berikan kunci API OpenAI Anda di kotak teks yang ditentukan.
Hasilkan Audio: Klik tombol untuk memulai proses konversi. Outputnya akan berupa file MP3 yang berisi dialog podcast.
Proyek ini dilisensikan di bawah Lisensi Apache 2.0. Lihat file LISENSI untuk informasi lebih lanjut.