AskyourDocuments
1.0.0
¡Bienvenido al sistema de control de calidad de documentos! Este repositorio contiene el código de un sistema que le permite hacer preguntas sobre sus documentos y obtener respuestas basadas en su contenido. Admite una amplia gama de formatos de documentos, incluidos PDF, Word, Excel, PowerPoint, archivos de texto e incluso imágenes.
git clone https://github.com/AiGptCode/AskyourDocuments.git
pip install transformers langchain fitz pillow textract pandas python-pptx opencv-python concurrent-futures
export HUGGINGFACE_API_TOKEN=your-api-key
main.py
e ingrese la ruta al directorio que contiene sus documentos: python AskyourDocuments.py
Nota: Si desea incluir imágenes en su búsqueda, asegúrese de que estén en un formato compatible (por ejemplo, JPEG, PNG) y que estén ubicadas en el mismo directorio que sus otros documentos.
Si desea contribuir a este proyecto, siga estos pasos:
git checkout -b my-feature-branch
git commit -am ' Add some feature '
git push origin my-feature-branch
Este proyecto está bajo la licencia MIT.
langchain
para proporcionar utilidades para crear y trabajar con modelos de lenguaje.fitz
para proporcionar utilidades para trabajar con archivos PDFPillow
para proporcionar utilidades para trabajar con archivos de imagen.textract
para proporcionar utilidades para extraer texto de varios formatos de archivo.pandas
para proporcionar utilidades para trabajar con datos tabulares en Pythonpython-pptx
para proporcionar utilidades para trabajar con archivos de PowerPointconcurrent-futures
para proporcionar una interfaz de alto nivel para ejecutar invocables de forma asincrónicaopencv-python
para proporcionar utilidades para trabajar con datos de imágenes y videos (para soporte de imágenes)