AskyourDocuments
1.0.0
Bienvenue dans le système d'assurance qualité des documents ! Ce référentiel contient le code d'un système qui vous permet de poser des questions sur vos documents et d'obtenir des réponses en fonction de leur contenu. Il prend en charge un large éventail de formats de documents, notamment PDF, Word, Excel, PowerPoint, les fichiers texte et même les images !
git clone https://github.com/AiGptCode/AskyourDocuments.git
pip install transformers langchain fitz pillow textract pandas python-pptx opencv-python concurrent-futures
export HUGGINGFACE_API_TOKEN=your-api-key
main.py
et entrez le chemin d'accès au répertoire contenant vos documents : python AskyourDocuments.py
Remarque : Si vous souhaitez inclure des images dans votre recherche, assurez-vous qu'elles sont dans un format pris en charge (par exemple, JPEG, PNG) et qu'elles se trouvent dans le même répertoire que vos autres documents.
Si vous souhaitez contribuer à ce projet, veuillez suivre ces étapes :
git checkout -b my-feature-branch
git commit -am ' Add some feature '
git push origin my-feature-branch
Ce projet est sous licence MIT.
langchain
pour fournir des utilitaires permettant de créer et d'utiliser des modèles de langagefitz
pour fournir des utilitaires permettant de travailler avec des fichiers PDFPillow
pour fournir des utilitaires permettant de travailler avec des fichiers imagetextract
pour fournir des utilitaires permettant d'extraire du texte à partir de différents formats de fichierspandas
pour fournir des utilitaires permettant de travailler avec des données tabulaires en Pythonpython-pptx
pour fournir des utilitaires permettant de travailler avec des fichiers PowerPointconcurrent-futures
pour fournir une interface de haut niveau pour l'exécution asynchrone des callablesopencv-python
pour fournir des utilitaires permettant de travailler avec des données image et vidéo (pour la prise en charge des images)