pdf to podcast Download - pdf to podcast -Quellcode-Download

pdf to podcast

AI-Quellcode

1.0.0

Herunterladen

pdf to podcast

Überblick

Dieses Projekt bietet ein Tool zum Konvertieren jedes PDF-Dokuments in eine Podcast-Episode! Mithilfe von Googles Gemini zur Dialoggenerierung und den Text-to-Speech-Modellen von OpenAI verarbeitet dieses Tool den Inhalt eines PDFs, generiert einen natürlichen Dialog, der für einen Audio-Podcast geeignet ist, und gibt ihn als MP3-Datei aus.

Merkmale

pdf to podcast konvertieren: Laden Sie eine PDF-Datei hoch und konvertieren Sie ihren Inhalt in einen Podcast-Dialog.
KI-gestützter Dialog: Verwendet Gemini LLM von Google, um ansprechende, natürliche Gespräche zu erstellen.
Hochwertiges Audio: Nutzt die Text-to-Speech-Funktion von OpenAI für lebensechte Stimmen.
Benutzerfreundliche Oberfläche: Einfache Benutzeroberfläche mit Gradio für einfache Interaktion.

Installation

Um das Projekt einzurichten, gehen Sie folgendermaßen vor:

Klonen Sie das Repository:

git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast

Abhängigkeiten installieren:
```
uv sync
```

Verwendung

API-Schlüssel einrichten:
Sie benötigen einen API-Schlüssel für OpenAI, den Sie entweder über die Schnittstelle übergeben oder als Umgebungsvariable OPENAI_API_KEY festlegen können.
Führen Sie die Anwendung aus:
```
python main.py
```
Dadurch wird eine Gradio-Oberfläche in Ihrem Webbrowser gestartet.
Laden Sie ein PDF hoch: Laden Sie das PDF-Dokument hoch, das Sie in einen Podcast umwandeln möchten.
Geben Sie den OpenAI-API-Schlüssel ein: Geben Sie Ihren OpenAI-API-Schlüssel in das dafür vorgesehene Textfeld ein.
Audio generieren: Klicken Sie auf die Schaltfläche, um den Konvertierungsvorgang zu starten. Die Ausgabe wird eine MP3-Datei sein, die den Podcast-Dialog enthält.