AskyourDocuments
1.0.0
欢迎使用文档质量检查系统!该存储库包含一个系统的代码,该系统允许您提出有关文档的问题并根据其内容获得答案。它支持多种文档格式,包括 PDF、Word、Excel、PowerPoint、文本文件,甚至图像!
git clone https://github.com/AiGptCode/AskyourDocuments.git
pip install transformers langchain fitz pillow textract pandas python-pptx opencv-python concurrent-futures
export HUGGINGFACE_API_TOKEN=your-api-key
main.py
脚本并输入包含文档的目录的路径: python AskyourDocuments.py
注意:如果您想在搜索中包含图像,请确保它们采用受支持的格式(例如 JPEG、PNG),并且与其他文档位于同一目录中。
如果您想为此项目做出贡献,请按照以下步骤操作:
git checkout -b my-feature-branch
git commit -am ' Add some feature '
git push origin my-feature-branch
该项目已获得 MIT 许可证的许可。
langchain
库,用于提供创建和使用语言模型的实用程序fitz
库提供处理 PDF 文件的实用程序Pillow
库提供处理图像文件的实用程序textract
库提供从各种文件格式中提取文本的实用程序pandas
库,用于提供在 Python 中处理表格数据的实用程序python-pptx
库,用于提供处理 PowerPoint 文件的实用程序concurrent-futures
库,用于为异步执行可调用对象提供高级接口opencv-python
库,用于提供处理图像和视频数据的实用程序(用于图像支持)