document answer langchain pinecone openai
1.0.0
Langchain提供了一種易於使用的集成,用於使用Pinecone和Openai的嵌入來處理和查詢文檔。借助此存儲庫,您可以加載PDF,將其內容分開,生成嵌入,並使用上述工具創建一個問答系統。
embbeding_doc.py
:用於加載PDF,分裂其內容,使用OpenAI生成嵌入的主要腳本,並用Pinecone保存它們。constants.py
:保存在存儲庫中使用的常數。app.py
:一種簡化的應用程序,可讓您使用提問鏈查詢嵌入式文檔。 設置配置:
您必須創建一個定義以下內容的config.py
文件:
OPENAI_API_KEY = 'YOUR_OPENAI_API_KEY'
PINECONE_API_KEY = 'YOUR_PINECONE_API_KEY'
PINECONE_API_ENVIRONMENT = 'YOUR_PINECONE_ENVIRONMENT'
運行embbeding_doc.py
:
這將加載提供的PDF,將其內容拆分,生成嵌入並將其保存到Pinecone中。
$ python embbeding_doc.py
啟動簡化應用程序:
使用shatlit運行app.py
腳本。
$ streamlit run app.py
應用程序運行後,您可以輸入與PDF內容相關的問題,它將使用創建的嵌入式和提問鏈提供相關答案。