Dieses Projekt bietet ein Tool zum Konvertieren jedes PDF-Dokuments in eine Podcast-Episode! Mithilfe von Googles Gemini zur Dialoggenerierung und den Text-to-Speech-Modellen von OpenAI verarbeitet dieses Tool den Inhalt eines PDFs, generiert einen natürlichen Dialog, der für einen Audio-Podcast geeignet ist, und gibt ihn als MP3-Datei aus.
Um das Projekt einzurichten, gehen Sie folgendermaßen vor:
Klonen Sie das Repository:
git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast
Abhängigkeiten installieren:
uv sync
API-Schlüssel einrichten:
Sie benötigen einen API-Schlüssel für OpenAI, den Sie entweder über die Schnittstelle übergeben oder als Umgebungsvariable OPENAI_API_KEY
festlegen können.
Führen Sie die Anwendung aus:
python main.py
Dadurch wird eine Gradio-Oberfläche in Ihrem Webbrowser gestartet.
Laden Sie ein PDF hoch: Laden Sie das PDF-Dokument hoch, das Sie in einen Podcast umwandeln möchten.
Geben Sie den OpenAI-API-Schlüssel ein: Geben Sie Ihren OpenAI-API-Schlüssel in das dafür vorgesehene Textfeld ein.
Audio generieren: Klicken Sie auf die Schaltfläche, um den Konvertierungsvorgang zu starten. Die Ausgabe wird eine MP3-Datei sein, die den Podcast-Dialog enthält.
Dieses Projekt ist unter der Apache 2.0-Lizenz lizenziert. Weitere Informationen finden Sie in der LICENSE-Datei.