Этот проект предоставляет инструмент для преобразования любого PDF-документа в эпизод подкаста! Используя Gemini от Google для генерации диалогов и модели преобразования текста в речь OpenAI, этот инструмент обрабатывает содержимое PDF-файла, генерирует естественный диалог, подходящий для аудиоподкаста, и выводит его в виде файла MP3.
Чтобы настроить проект, выполните следующие действия:
Клонируем репозиторий:
git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast
Установите зависимости:
uv sync
Настройте ключ(и) API:
Вам понадобится ключ API для OpenAI, который вы можете либо передать через интерфейс, либо установить как переменную среды OPENAI_API_KEY
.
Запустите приложение:
python main.py
Это запустит интерфейс Gradio в вашем веб-браузере.
Загрузить PDF-файл. Загрузите PDF-документ, который хотите преобразовать в подкаст.
Введите ключ API OpenAI: укажите ключ API OpenAI в специальном текстовом поле.
Создать аудио: нажмите кнопку, чтобы начать процесс преобразования. Результатом будет файл MP3, содержащий диалог подкаста.
Этот проект распространяется по лицензии Apache 2.0. Дополнительную информацию смотрите в файле LICENSE.