Ce projet fournit un outil pour convertir n'importe quel document PDF en épisode de podcast ! Utilisant Gemini de Google pour la génération de dialogues et les modèles de synthèse vocale d'OpenAI, cet outil traite le contenu d'un PDF, génère un dialogue naturel adapté à un podcast audio et le produit sous forme de fichier MP3.
Pour configurer le projet, suivez ces étapes :
Clonez le dépôt :
git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast
Installer les dépendances :
uv sync
Configurer la ou les clés API :
Vous aurez besoin d'une clé API pour OpenAI que vous pouvez soit transmettre via l'interface, soit définir comme variable d'environnement OPENAI_API_KEY
.
Exécutez l'application :
python main.py
Cela lancera une interface Gradio dans votre navigateur Web.
Télécharger un PDF : téléchargez le document PDF que vous souhaitez convertir en podcast.
Entrez la clé API OpenAI : fournissez votre clé API OpenAI dans la zone de texte désignée.
Générer de l'audio : cliquez sur le bouton pour démarrer le processus de conversion. Le résultat sera un fichier MP3 contenant le dialogue du podcast.
Ce projet est sous licence Apache 2.0. Voir le fichier LICENSE pour plus d'informations.