pdf to podcast
1.0.0
該專案提供了一個將任何 PDF 文件轉換為播客劇集的工具!該工具使用 Google 的 Gemini 進行對話生成和 OpenAI 的文字轉語音模型,處理 PDF 內容,產生適合音訊播客的自然對話,並將其輸出為 MP3 檔案。
若要設定項目,請依照下列步驟操作:
克隆儲存庫:
git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast
安裝依賴項:
uv sync
設定 API 金鑰:
您需要 OpenAI 的 api 金鑰,您可以透過介面傳遞該金鑰,也可以將其設定為OPENAI_API_KEY
環境變數。
運行應用程式:
python main.py
這將在您的網頁瀏覽器中啟動 Gradio 介面。
上傳 PDF:上傳要轉換為播客的 PDF 文件。
輸入 OpenAI API 金鑰:在指定文字方塊中提供您的 OpenAI API 金鑰。
產生音訊:點選按鈕開始轉換過程。輸出將是包含播客對話的 MP3 檔案。
該專案根據 Apache 2.0 許可證獲得許可。有關詳細信息,請參閱許可證文件。