Document Question Answering GenAI
1.0.0
該項目使用Chromadb vector數據庫Langchain構建了由大語言模型(LLM)和Dolly-V2-3B等大型語言模型(LLM)提供動力的文檔。它被部署在簡化中。
鏈接到應用程序:https://document-question-answering-kedarghule.streamlit.app/
注意:由於簡化的內存問題,該應用程序有時可能無法正常工作並給出錯誤。這是由於簡化的1GB內存限制。這是一個視頻,顯示了應用程序的工作原理:https://drive.google.com/file/d/1nkvdqdx1emwtzqhkyzu_2ijzgog-us8o/view?usp = sharing?
在當今信息超負荷時代,個人和組織面臨有效從大量文本數據中提取相關信息的挑戰。傳統的搜索引擎通常在為用戶提出的特定問題提供精確和上下文感知的答案方面缺乏。結果,對先進的自然語言處理(NLP)技術的需求越來越大,以實現準確的文檔答案(DQA)系統。
該項目的目的是開發一個文檔問題,該應用程序由大型語言模型(LLMS)提供支持,例如Falcon-7b和Dolly-V2-3B,利用Langchain平台和Chromadb Vector數據庫。通過利用LLM的功能,該應用程序旨在為用戶在給定的文檔語料庫中為其問題提供準確,全面的答案。
.txt
文件和.docx
文件。上傳後, .docx
文件將轉換為.txt
文件。使用Langchain,使用Textloader加載文檔。