¡Este proyecto proporciona una herramienta para convertir cualquier documento PDF en un episodio de podcast! Utilizando Gemini de Google para la generación de diálogos y los modelos de texto a voz de OpenAI, esta herramienta procesa el contenido de un PDF, genera un diálogo natural adecuado para un podcast de audio y lo genera como un archivo MP3.
Para configurar el proyecto, siga estos pasos:
Clonar el repositorio:
git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast
Instalar dependencias:
uv sync
Configurar claves API:
Necesitará una clave de API para OpenAI que puede pasar a través de la interfaz o configurar como la variable de entorno OPENAI_API_KEY
.
Ejecute la aplicación:
python main.py
Esto iniciará una interfaz de Gradio en su navegador web.
Sube un PDF: sube el documento PDF que deseas convertir en un podcast.
Ingrese la clave API de OpenAI: proporcione su clave API de OpenAI en el cuadro de texto designado.
Generar audio: haga clic en el botón para iniciar el proceso de conversión. El resultado será un archivo MP3 que contendrá el diálogo del podcast.
Este proyecto está bajo la licencia Apache 2.0. Consulte el archivo de LICENCIA para obtener más información.