document answer langchain pinecone openai
1.0.0
Langchainは、PineconeとOpenaiの埋め込みでドキュメントを処理およびクエリするための使いやすい統合を提供します。このリポジトリを使用すると、PDFをロードし、内容を分割し、埋め込みを生成し、前述のツールを使用して質問回答システムを作成できます。
embbeding_doc.py
をロードし、コンテンツを分割し、Openaiを使用して埋め込みを生成し、Pineconeで保存するためのプライマリスクリプト。constants.py
:リポジトリ全体で使用される定数を保持します。app.py
:質問チェーンを使用して組み込みドキュメントを照会できるための流線アプリケーション。 設定設定:
以下を定義するconfig.py
ファイルを作成する必要があります。
OPENAI_API_KEY = 'YOUR_OPENAI_API_KEY'
PINECONE_API_KEY = 'YOUR_PINECONE_API_KEY'
PINECONE_API_ENVIRONMENT = 'YOUR_PINECONE_ENVIRONMENT'
embbeding_doc.py
を実行:
これにより、提供されたPDFがロードされ、コンテンツを分割し、埋め込みを生成し、それらを松ぼっくりに保存します。
$ python embbeding_doc.py
RimeLitアプリケーションを開始します:
retrylittを使用して、 app.py
スクリプトを実行します。
$ streamlit run app.py
アプリケーションが実行されたら、PDFコンテンツに関連する質問を入力できます。これにより、作成された埋め込みと質問チェーンを使用して関連する回答が提供されます。