Doc-Chatbot: GPT x Pinecone x Langchain
Функции
- Создайте несколько тем, чтобы поговорить о
- Храните любое количество файлов по каждой теме
- Создайте любое количество чатов (окна чата) для каждой темы
- Загрузить файлы, преобразовать их в Entgeddings, хранить встроения в пространстве имен и загрузить в Pinecone и удалить пространства имен Pinecone из браузера из браузера
- Хранить и автоматически получить историю чата для всех чатов с местным хранилищем
- Поддерживает
.pdf
, .docx
и .txt
+ LangChain and Pinecone
Примечание. Если вы хотите настроить это с помощью Google Auth и MongoDB (в отличие от No Auth и использования локального хранилища), посмотрите на эту ветвь: MongoDB-AUTH. Тем не менее, этот репо является несколькими важными коммитами, стоящими за этим, и им не хватает определенных особенностей, поэтому имейте это в виду.
Основная зона чата 
Настройки страницы

Локальная настройка и разработка
Если вы хотите запустить это на локальном уровне и развернуть свою собственную версию, выполните следующие шаги.
Клонировать репо
git clone https://github.com/dissorial/doc-chatbot.git
Настройка Pinecone
API -ключ
Создайте учетную запись на Pinecone. Перейдите к Indexes
и Create index
. Введите любое имя, поместите 1536
для Dimensions
и оставьте остальное по умолчанию. Затем перейдите к API keys
и Create API key
.
Имя индекса
Самоэкспланирующее
Среда Pinecone
Прямо рядом с вашим именем индекса, например, us-west2-rkw
Установите пакеты
Настройка вашего файла .env
- Переименовать
.env.example
to .env
- Ваш файл
.env
должен выглядеть так:
Узел среды
- Развитие по умолчанию. В производстве установите это на «производство» (без цитат)
Другой
- В
utils/makechain.ts
отрегулируйте QA_PROMPT
для вашего собственного использования. Измените modelName
в new OpenAI
на gpt-4
, если у вас есть доступ к нему.
Развертывание
Добавьте их в свой файл .env
:
NEXTAUTH_URL=http://localhost:3000
NEXTAUTH_SECRET=
JWT_SECRET=
Nextauth Secret
- Вы можете генерировать это, используя
openssl rand -base64 32
в Git Bash.
JWT Секрет
- Вы можете генерировать это, используя
openssl rand -base64 32
в Git Bash.
NextAuth URL
- По умолчанию http: // localhost: 3000. В производстве это должен быть URL -адрес вашего развернутого приложения.
Запустить приложение
Поиск неисправностей
Общие ошибки
- Убедитесь, что вы запускаете последнюю версию узла. Чтобы проверить вашу версию, запустите узел -v.
- Если вы сталкиваетесь с проблемами с определенным файлом, попробуйте сначала преобразовать его в текст или попробуйте другой файл. Возможно, что файл поврежден, отсканирован или требует преобразования OCR в текст.
- Убедитесь, что вы используете те же версии Langchain и Pinecone, что и этот репозиторий.
Ошибки Pinecone
- Убедитесь, что вы установили векторные размеры на 1536.
- Обратите внимание, что индексы Pinecone для пользователей в плане стартера (бесплатно) удаляются после 7 дней бездействия. Чтобы предотвратить это, отправьте запрос API в Pinecone, чтобы сбросить счетчик до 7 дней.
- Если проблемы сохраняются, рассмотрите возможность начать Fresh с нового проекта Pinecone, индекса и клонированного репозитория.
Кредит
Этот репозиторий изначально был вилкой репозитория GPT-4 & Langchain от Mayooear, но претерпел много серьезных изменений в этом репо.
Фронт этого репо вдохновлен CHATGPT.