pdf to podcastダウンロード - pdf to podcastソースコードのダウンロード

pdf to podcast

AI ソースコード

1.0.0

ダウンロード

pdf to podcast

概要

このプロジェクトは、PDF ドキュメントをポッドキャストエピソードに変換するツールを提供します。このツールは、ダイアログ生成に Google の Gemini と OpenAI のテキスト読み上げモデルを使用して、PDF のコンテンツを処理し、オーディオポッドキャストに適した自然なダイアログを生成し、MP3 ファイルとして出力します。

特徴

pdf to podcast変換 : PDF をアップロードし、そのコンテンツをポッドキャストダイアログに変換します。
AI を活用した対話: Google の Gemini LLM を使用して、魅力的で自然な会話を作成します。
高品質オーディオ: OpenAI のテキスト読み上げ機能を利用して、本物のような音声を実現します。
ユーザーフレンドリーなインターフェイス: Gradio を使用したシンプルなインターフェイスで、簡単に操作できます。

インストール

プロジェクトを設定するには、次の手順に従います。

リポジトリのクローンを作成します。

git clone https://github.com/knowsuchagency/pdf-to-podcast.git
cd pdf-to-podcast

依存関係をインストールします。
```
uv sync
```

使用法

API キーを設定します。
OpenAI の API キーが必要になります。これは、インターフェイスを介して渡すか、 OPENAI_API_KEY環境変数として設定できます。
アプリケーションを実行します。
```
python main.py
```
これにより、Web ブラウザで Gradio インターフェイスが起動します。
PDF をアップロードする:ポッドキャストに変換する PDF ドキュメントをアップロードします。
OpenAI API キーを入力:指定されたテキストボックスに OpenAI API キーを入力します。
オーディオの生成:ボタンをクリックして変換プロセスを開始します。出力は、ポッドキャストのダイアログを含む MP3 ファイルになります。