AskyourDocuments
1.0.0
歡迎使用文檔品質檢查系統!該儲存庫包含一個系統的程式碼,該系統允許您提出有關文件的問題並根據其內容獲得答案。它支援多種文件格式,包括 PDF、Word、Excel、PowerPoint、文字文件,甚至是圖像!
git clone https://github.com/AiGptCode/AskyourDocuments.git
pip install transformers langchain fitz pillow textract pandas python-pptx opencv-python concurrent-futures
export HUGGINGFACE_API_TOKEN=your-api-key
main.py
腳本並輸入包含文件的目錄的路徑: python AskyourDocuments.py
注意:如果您想在搜尋中包含圖像,請確保它們採用受支援的格式(例如 JPEG、PNG),並且與其他文件位於同一目錄中。
如果您想為此專案做出貢獻,請按照以下步驟操作:
git checkout -b my-feature-branch
git commit -am ' Add some feature '
git push origin my-feature-branch
該項目已獲得 MIT 許可證的許可。
langchain
庫,用於提供創建和使用語言模型的實用程序fitz
庫提供處理 PDF 文件的實用程序Pillow
庫提供處理圖像檔案的實用程序textract
庫提供從各種文件格式中提取文字的實用程序pandas
庫,用於提供在 Python 中處理表格資料的實用程序python-pptx
庫,用於提供處理 PowerPoint 文件的實用程序concurrent-futures
庫,用於為非同步執行可調用物件提供高級接口opencv-python
庫,用於提供處理圖像和視訊資料的實用程式(用於圖像支援)