Репо, демонстрирующее инструмент обобщения ИИ.
Этот репозиторий демонстрирует простой, но эффективный инструмент для обобщения документов. Он может работать с текстовыми и PDF-документами на любом языке, поддерживаемом базовым LLM (по умолчанию Mistral).
Установите следующие зависимости (в macOS):
pip3 install -r requirements.txt
mistral-7b-openorca.Q5_K_M.gguf
из репозитория Hugging Face TheBloke/Mistral-7B-OpenOrca-GGUF в локальный каталог models
. Обратите внимание, что вы можете экспериментировать с альтернативными моделями, просто обновите переменные MODEL_FILE
и MODEL_CONTEXT_WINDOW
в web-ui.py
и/или Notebook.ipynb
.
Чтобы запустить веб-интерфейс, просто запустите python3 ./web-ui.py
в папке репо. Это должно открыть интерфейс веб-интерфейса в браузере.
Этот инструмент также можно использовать как Jupyter Labs/Notebook: вы открываете Notebook.ipynb
в Jupyter Labs.
В зависимости от размера документа этот инструмент работает в следующих режимах:
Вся обработка выполняется локально на компьютере пользователя.
mistral-7b-openorca.Q5_K_M.gguf
) имеет около 5,1 ГБ.Относительно небольшие и средние документы (пара страниц) должны помещаться в одно контекстное окно, что приводит к времени обработки около 40 секунд на Apple MBP с чипом M1.
Никто не знает проблемы.