document answer langchain pinecone openai
1.0.0
Langchain提供了一种易于使用的集成,用于使用Pinecone和Openai的嵌入来处理和查询文档。借助此存储库,您可以加载PDF,将其内容分开,生成嵌入,并使用上述工具创建一个问答系统。
embbeding_doc.py
:用于加载PDF,分裂其内容,使用OpenAI生成嵌入的主要脚本,并用Pinecone保存它们。constants.py
:保存在存储库中使用的常数。app.py
:一种简化的应用程序,可让您使用提问链查询嵌入式文档。 设置配置:
您必须创建一个定义以下内容的config.py
文件:
OPENAI_API_KEY = 'YOUR_OPENAI_API_KEY'
PINECONE_API_KEY = 'YOUR_PINECONE_API_KEY'
PINECONE_API_ENVIRONMENT = 'YOUR_PINECONE_ENVIRONMENT'
运行embbeding_doc.py
:
这将加载提供的PDF,将其内容拆分,生成嵌入并将其保存到Pinecone中。
$ python embbeding_doc.py
启动简化应用程序:
使用shatlit运行app.py
脚本。
$ streamlit run app.py
应用程序运行后,您可以输入与PDF内容相关的问题,它将使用创建的嵌入式和提问链提供相关答案。