Langchain proporciona una integración fácil de usar para procesar y consultar documentos con Pinecone y los incrustaciones de OpenAI. Con este repositorio, puede cargar un PDF, dividir su contenido, generar integridades y crear un sistema de preguntas sobre preguntas utilizando las herramientas mencionadas anteriormente.
embbeding_doc.py
: el script principal para cargar un PDF, dividir su contenido, generar embedidas usando OpenAI y guardarlos con Pinecone.constants.py
: contiene las constantes utilizadas en el repositorio.app.py
: una aplicación de transmisión que le permite consultar los documentos integrados utilizando una cadena de preguntas. Configuración de configuración :
Debe crear un archivo config.py
que define lo siguiente:
OPENAI_API_KEY = 'YOUR_OPENAI_API_KEY'
PINECONE_API_KEY = 'YOUR_PINECONE_API_KEY'
PINECONE_API_ENVIRONMENT = 'YOUR_PINECONE_ENVIRONMENT'
Ejecute embbeding_doc.py
:
Esto cargará el PDF proporcionado, dividirá su contenido, generará incrustaciones y los guardará en Pinecone.
$ python embbeding_doc.py
Start the Streamlit Application :
Use Streamlit to run the app.py
script.
$ streamlit run app.py
Una vez que la aplicación se esté ejecutando, puede ingresar preguntas relacionadas con el contenido de PDF, y proporcionará respuestas relevantes utilizando los incrustaciones creadas y la cadena de preguntas de preguntas.