AskyourDocuments
1.0.0
Добро пожаловать в систему контроля качества документов! Этот репозиторий содержит код системы, которая позволяет вам задавать вопросы о ваших документах и получать ответы на основе их содержания. Он поддерживает широкий спектр форматов документов, включая PDF, Word, Excel, PowerPoint, текстовые файлы и даже изображения!
git clone https://github.com/AiGptCode/AskyourDocuments.git
pip install transformers langchain fitz pillow textract pandas python-pptx opencv-python concurrent-futures
export HUGGINGFACE_API_TOKEN=your-api-key
main.py
и введите путь к каталогу, содержащему ваши документы: python AskyourDocuments.py
Примечание. Если вы хотите включить изображения в поиск, убедитесь, что они имеют поддерживаемый формат (например, JPEG, PNG) и находятся в том же каталоге, что и другие ваши документы.
Если вы хотите внести свой вклад в этот проект, пожалуйста, выполните следующие действия:
git checkout -b my-feature-branch
git commit -am ' Add some feature '
git push origin my-feature-branch
Этот проект лицензируется по лицензии MIT.
langchain
для предоставления утилит для создания и работы с языковыми моделями.fitz
для предоставления утилит для работы с PDF-файлами.Pillow
для предоставления утилит для работы с файлами изображений.textract
библиотека, предоставляющая утилиты для извлечения текста из файлов различных форматов.pandas
для предоставления утилит для работы с табличными данными в Python.python-pptx
для предоставления утилит для работы с файлами PowerPoint.concurrent-futures
для предоставления высокоуровневого интерфейса для асинхронного выполнения вызываемых объектов.opencv-python
для предоставления утилит для работы с изображениями и видеоданными (для поддержки изображений)