Этот проект создает приложение, отвечающее на вопрос о документе, работающий на крупных языковых моделях (LLMS), таких как Falcon-7b и Dolly-V2-3b, используя Langchain, векторную базу данных ChromADB. Это развернуто на потоковой линии.
Ссылка на приложение: https://document-question-answering-kedarghule.streamlit.app/
Примечание. Из -за проблем с памятью с потоковой личкой приложение может иногда не работать и не дать ошибку. Это связано с ограничением памяти 1 ГБ с помощью потока. Вот видео, которое показывает, как работает приложение: https://drive.google.com/file/d/1nkvdqdx1emwtzqhkyzu_2ijzgog-us8o/view?usp=sharing
В сегодняшнюю эпоху информационной перегрузки отдельные лица и организации сталкиваются с проблемой эффективного извлечения соответствующей информации из огромных объемов текстовых данных. Традиционные поисковые системы часто не хватают в предоставлении точных и контекстных ответов на конкретные вопросы, заданные пользователями. В результате растет растущая потребность в методах передовой обработки естественного языка (NLP) для обеспечения точных систем ответа на вопрос о документах (DQA).
Цель этого проекта-разработка вопроса о документе, отвечающем на приложение, основанное на крупных языковых моделях (LLMS), таких как Falcon-7B и Dolly-V2-3B, используя платформу Langchain и базу данных вектора ChromADB. Используя возможности LLMS, это приложение направлено на то, чтобы предоставить пользователям точные и всеобъемлющие ответы на свои вопросы в данном корпусе документа.
.txt
и файлов .docx
. После загрузки файл .docx
преобразуется в файл .txt
. Используя Langchain, документ загружается с помощью Textloader.