Este projeto fornece uma ferramenta para converter qualquer documento PDF em um episódio de podcast! Usando o Gemini do Google para geração de diálogo e os modelos de conversão de texto em fala da OpenAI, esta ferramenta processa o conteúdo de um PDF, gera um diálogo natural adequado para um podcast de áudio e o gera como um arquivo MP3.
Para configurar o projeto, siga estas etapas:
Clone o repositório:
git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast
Instale dependências:
uv sync
Configurar chaves de API:
Você precisará de uma chave de API para OpenAI que pode ser passada pela interface ou definida como a variável de ambiente OPENAI_API_KEY
.
Execute o aplicativo:
python main.py
Isso iniciará uma interface Gradio em seu navegador.
Carregar um PDF: carregue o documento PDF que deseja converter em podcast.
Insira a chave da API OpenAI: Forneça sua chave da API OpenAI na caixa de texto designada.
Gerar Áudio: Clique no botão para iniciar o processo de conversão. A saída será um arquivo MP3 contendo o diálogo do podcast.
Este projeto está licenciado sob a licença Apache 2.0. Consulte o arquivo LICENSE para obter mais informações.