doc-chatbot: gpt x pinecone x Langchain
Caractéristiques
- Créer plusieurs sujets pour discuter
- Stockez n'importe quel nombre de fichiers sur chaque sujet
- Créez un certain nombre de chats (chat Windows) pour chaque sujet
- Téléchargez des fichiers, convertissez-les en intégres, stockez les incorporations dans un espace de noms et téléchargez sur Pinecone, et supprimez
- Stocker et récupérer automatiquement l'historique du chat pour tous les chats avec le stockage local
- Prend en charge
.pdf
, .docx
et .txt
+ LangChain and Pinecone
Remarque: Si vous souhaitez configurer cela avec Google Auth et MongoDB (par opposition à No Auth et en utilisant le stockage local), consultez cette branche: MongoDB-and-Auth. Cependant, ce repo est plusieurs engagements importants derrière celui-ci et manque de certaines fonctionnalités, alors gardez cela à l'esprit.
Zone de chat principale 
Page des paramètres

Configuration et développement locaux
Si vous souhaitez exécuter cela localement et déployer votre propre version, suivez les étapes ci-dessous.
Cloner le repo
git clone https://github.com/dissorial/doc-chatbot.git
Configuration de Pincone
Clé API
Créez un compte sur Pinecone. Allez dans Indexes
et Create index
. Entrez n'importe quel nom, mettez 1536
pour Dimensions
et laissez le reste par défaut. Allez ensuite aux API keys
et Create API key
.
Nom d'index
Explicite
Environnement de pince
Juste à côté de votre nom d'index, par exemple us-west2-rkw
Installer des packages
Configurez votre fichier .env
- Renommer
.env.example
à .env
- Votre fichier
.env
devrait ressembler à ceci:
Environnement de nœud
- Développement par défaut. En production, définissez ceci sur la «production» (sans les citations)
Autre
- Dans
utils/makechain.ts
, ajustez le QA_PROMPT
pour votre propre Usecase. Changer modelName
dans new OpenAI
à gpt-4
, si vous y avez accès.
Déploiement
Ajoutez-les à votre fichier .env
:
NEXTAUTH_URL=http://localhost:3000
NEXTAUTH_SECRET=
JWT_SECRET=
Secret NextAuth
- Vous pouvez générer cela en exécutant
openssl rand -base64 32
dans Git Bash.
Secret JWT
- Vous pouvez générer cela en exécutant
openssl rand -base64 32
dans Git Bash.
URL NextAuth
- La valeur par défaut est http: // localhost: 3000. En production, cela devrait être l'URL de votre application déployée.
Exécutez l'application
Dépannage
Erreurs générales
- Assurez-vous que vous exécutez la dernière version de Node. Pour vérifier votre version, exécutez le nœud -v.
- Si vous rencontrez des problèmes avec un fichier spécifique, essayez d'abord de le convertir en texte ou essayez un fichier différent. Il est possible que le fichier soit corrompu, scanné ou exige que l'OCR soit converti en texte.
- Confirmez que vous utilisez les mêmes versions de Langchain et PineCone que ce référentiel.
Erreurs de Pinone
- Confirmez que vous avez réglé les dimensions vectorielles sur 1536.
- Notez que les index de pince pour les utilisateurs du plan de démarrage (gratuit) sont supprimés après 7 jours d'inactivité. Pour éviter cela, envoyez une demande d'API à Pinecone pour réinitialiser le comptoir avant 7 jours.
- Si les problèmes persistent, envisagez de démarrer frais avec un nouveau projet Pinecone, un index et un référentiel cloné.
Crédit
Ce référentiel était à l'origine une fourche du référentiel GPT-4 & Langchain par Mayooear, mais a subi de nombreux changements majeurs dans ce référentiel.
Frontend de ce dépôt est inspiré par le chatgpt.