pdf to podcast
1.0.0
このプロジェクトは、PDF ドキュメントをポッドキャスト エピソードに変換するツールを提供します。このツールは、ダイアログ生成に Google の Gemini と OpenAI のテキスト読み上げモデルを使用して、PDF のコンテンツを処理し、オーディオ ポッドキャストに適した自然なダイアログを生成し、MP3 ファイルとして出力します。
プロジェクトを設定するには、次の手順に従います。
リポジトリのクローンを作成します。
git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast
依存関係をインストールします。
uv sync
API キーを設定します。
OpenAI の API キーが必要になります。これは、インターフェイスを介して渡すか、 OPENAI_API_KEY
環境変数として設定できます。
アプリケーションを実行します。
python main.py
これにより、Web ブラウザで Gradio インターフェイスが起動します。
PDF をアップロードする:ポッドキャストに変換する PDF ドキュメントをアップロードします。
OpenAI API キーを入力:指定されたテキストボックスに OpenAI API キーを入力します。
オーディオの生成:ボタンをクリックして変換プロセスを開始します。出力は、ポッドキャストのダイアログを含む MP3 ファイルになります。
このプロジェクトは、Apache 2.0 ライセンスに基づいてライセンスされています。詳細については、LICENSE ファイルを参照してください。