document answer langchain pinecone openai
1.0.0
Langchain은 Pinecone 및 OpenAi의 임베딩으로 문서를 처리하고 쿼리하기 위해 사용하기 쉬운 통합을 제공합니다. 이 저장소를 사용하면 PDF를로드하고 내용을 분할하고 임베딩을 생성하며 위에서 언급 한 도구를 사용하여 질문 응답 시스템을 만들 수 있습니다.
embbeding_doc.py
: PDF를로드하고, 내용을 분할하고, OpenAI를 사용하여 임베딩을 생성하고, Pinecone으로 저장하기위한 기본 스크립트.constants.py
: 저장소에 사용되는 상수를 보유합니다.app.py
: 질문 응답 체인을 사용하여 내장 된 문서를 쿼리 할 수있는 간소화 된 응용 프로그램. 구성 설정 :
다음을 정의하는 config.py
파일을 작성해야합니다.
OPENAI_API_KEY = 'YOUR_OPENAI_API_KEY'
PINECONE_API_KEY = 'YOUR_PINECONE_API_KEY'
PINECONE_API_ENVIRONMENT = 'YOUR_PINECONE_ENVIRONMENT'
embbeding_doc.py
실행하십시오 :
제공된 PDF를로드하고 컨텐츠를 분할하고 임베딩을 생성 한 후 Pinecone에 저장합니다.
$ python embbeding_doc.py
간소화 응용 프로그램 시작 :
간소화를 사용하여 app.py
스크립트를 실행하십시오.
$ streamlit run app.py
애플리케이션이 실행되면 PDF 컨텐츠와 관련된 질문을 입력 할 수 있으며 생성 된 임베딩 및 질문 응답 체인을 사용하여 관련 답변을 제공합니다.