Téléchargement IncarnaMind - Téléchargement du code source IncarnaMind

IncarnaMind

Autre code source

1.0.0

Télécharger

? Incarnamine

? En un mot

Incarnamind vous permet de discuter avec vos documents personnels? (PDF, TXT) Utilisation de modèles de grande langue (LLMS) comme GPT (Présentation de l'architecture). Alors qu'Openai a récemment lancé une API à réglage fin pour les modèles GPT, il ne permet pas aux modèles de base pré-entraînés d'apprendre de nouvelles données, et les réponses peuvent être sujettes aux hallucinations factuelles. Utilisez notre mécanisme de chasse à la fenêtre coulissante et notre récupération d'ensemble permet une interrogation efficace des informations à grains fins et à grains grossiers dans vos documents de vérité sur le terrain pour augmenter les LLM.

N'hésitez pas à l'utiliser et nous nous félicitons de commentaires et de nouvelles suggestions de fonctionnalités ?.

Nouvelles mises à jour

Support LLMS open-source et local

Modèle recommandé: Nous avons principalement testé avec les modèles de la série LLAMA2 et recommandons d'utiliser LLAMA2-70B-CHAT (version complète ou GGUF) pour des performances optimales. N'hésitez pas à expérimenter d'autres LLM.
Exigences du système: il nécessite plus de 35 Go de GPU RAM pour exécuter la version quantifiée GGUF.

Options de LLMS open-source alternative

RAM insuffisant: si vous êtes limité par GPU RAM, envisagez d'utiliser l'API Together.ai. Il prend en charge LLAMA2-70B-CHAT et la plupart des autres LLMS open-source. De plus, vous obtenez 25 $ en utilisation gratuite.
À venir: des modèles plus petits et rentables et affinés seront publiés à l'avenir.

Comment utiliser les modèles GGUF

Pour des instructions sur l'acquisition et l'utilisation de GGUF LLM quantifiée (similaire à GGML), veuillez vous référer à cette vidéo (de 10h45 à 12h30).

Voici un tableau de comparaison des différents modèles que j'ai testés, pour référence uniquement:

Métrique	Gpt-4	GPT-3.5	Claude 2.0	LLAMA2-70B	Llama2-70b-ganguf	LLAMA2-70B-API
Raisonnement	Haut	Moyen	Haut	Moyen	Moyen	Moyen
Vitesse	Moyen	Haut	Moyen	Très bas	Faible	Moyen
RAM GPU	N / A	N / A	N / A	Très haut	Haut	N / A
Sécurité	Faible	Faible	Faible	Haut	Haut	Faible

Démo

Démo.mp4

Défis abordés

Chunking fixe : les outils de chiffon traditionnels reposent sur des tailles de morceaux fixes, limitant leur adaptabilité dans la gestion de la complexité et du contexte variables des données.
Précision vs sémantique : les méthodes de récupération actuelles se concentrent généralement sur la compréhension sémantique ou la récupération précise, mais rarement les deux.
Limitation à un seul document : de nombreuses solutions ne peuvent interroger qu'un document à la fois, restreignant la récupération d'informations à plusieurs documents.
Stabilité : Incarnamind est compatible avec Openai GPT, Anthropic Claude, Llama2 et autres LLMS open-source, assurant une analyse stable.

Caractéristiques clés

Chunking adaptatif : notre technique de section de fenêtre coulissante ajuste dynamiquement la taille et la position de la fenêtre pour le chiffon, équilibrant l'accès aux données à grain fin et grossier en fonction de la complexité et du contexte des données.
QA conversationnel multi-documents : prend en charge simultanément les requêtes simples et multi-hop sur plusieurs documents, brisant la limitation d'un seul document.
Compatibilité des fichiers : prend en charge les formats de fichiers PDF et TXT.
Compatibilité du modèle LLM : prend en charge Openai GPT, Anthropic Claude, Llama2 et autres LLMS open-source.

? Architecture

Architecture de haut niveau

Chunking de fenêtre coulissante

Commencer

1. Installation

L'installation est simple, il vous suffit d'exécuter quelques commandes.

1.0. Condition préalable

3,8 ≤ python <3,11 avec conda
Un / toute la clé de l'API Openai, la clé API Claude anthropique, ensemble.ai API Key ou HuggingFace Toekn pour les modèles Meta Llama
Et bien sûr, vos propres documents.

1.1. Cloner le référentiel

git clone https://github.com/junruxiong/IncarnaMind
cd IncarnaMind

1.2. Installation

Créer un environnement virtuel Conda:

conda create -n IncarnaMind python=3.10

Activer:

conda activate IncarnaMind

Installez toutes les exigences:

pip install -r requirements.txt

Installez la LLAMA-CPP séparément si vous souhaitez exécuter des LLM locales quantifiées:

Pour le support GPUS NVIDIA , utilisez cuBLAS

CMAKE_ARGS= " -DLLAMA_CUBLAS=on " FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

Pour le support Apple Metal ( M1/M2 ), utilisez

CMAKE_ARGS= " -DLLAMA_METAL=on "  FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

Configurez votre / toutes les touches API dans le fichier configParser.ini :

[tokens]
OPENAI_API_KEY = (replace_me)
ANTHROPIC_API_KEY = (replace_me)
TOGETHER_API_KEY = (replace_me)
# if you use full Meta-Llama models, you may need Huggingface token to access.
HUGGINGFACE_TOKEN = (replace_me)

(Facultatif) Configuration de vos paramètres personnalisés dans le fichier configParser.ini :

[parameters]
PARAMETERS 1 = (replace_me)
PARAMETERS 2 = (replace_me)
...
PARAMETERS n = (replace_me)

2. Utilisation

2.1. Téléchargez et traitez vos fichiers

Mettez tous vos fichiers (veuillez nommer correctement chaque fichier pour maximiser les performances) dans le répertoire / données et exécuter la commande suivante pour ingérer toutes les données: (vous pouvez supprimer des exemples de fichiers dans le répertoire / données avant d'exécuter la commande)

python docs2db.py

2.2. Courir

Afin de démarrer la conversation, exécutez une commande comme:

python main.py

2.3. Discuter et poser des questions

Attendez que le script nécessite votre entrée comme celle ci-dessous.

Human:

2.4. Autres

Lorsque vous commencez un chat, le système générera automatiquement un fichier incarnamind.log . Si vous souhaitez modifier la journalisation, veuillez modifier dans le fichier configParser.ini .

[logging]
enabled = True
level = INFO
filename = IncarnaMind.log
format = %(asctime)s [%(levelname)s] %(name)s: %(message)s

Limites

La citation n'est pas prise en charge pour la version actuelle, mais il sortira bientôt.
Capacités asynchrones limitées.

Fonctionnalités à venir

Interface d'interface utilisateur frontal
LLMS open-source à petite taille à réglage fin
Support OCR
Optimisation asynchrone
Prise en charge plus de formats de documents

? Remerciements

Un merci spécial à Langchain, Chroma DB, LocalGpt, Llama-CPP pour leurs précieuses contributions à la communauté open-source. Leur travail a contribué à faire du projet Incarnamind une réalité.

? Citation

Si vous souhaitez citer notre travail, veuillez utiliser l'entrée Bibtex suivante:

 @misc { IncarnaMind2023 ,
  author = { Junru Xiong } ,
  title = { IncarnaMind } ,
  year = { 2023 } ,
  publisher = { GitHub } ,
  journal = { GitHub Repository } ,
  howpublished = { url{https://github.com/junruxiong/IncarnaMind} }
}