Téléchargement de JARVIS ChatGPT - Téléchargement du code source JARVIS ChatGPT

JARVIS ChatGPT

Autre code source

1.0.0

Télécharger

JARVIS-CHATGPT: Un assistant conversationnel équipé de la voix de Jarvis

Un assistant interactif basé sur la voix équipé d'une variété de voix synthétiques (y compris la voix de Jarvis d'Ironman)

Image par MidJourney Ai

Avez-vous déjà rêvé de demander des conseils système hyper-intelligents pour améliorer votre armure? Maintenant, vous pouvez! Eh bien, peut-être pas la partie armure ... ce projet exploite Openai Whisper, Openai Chatgpt et IBM Watson.

Motivation du projet:

Plusieurs fois, les idées viennent dans le pire moment et ils se sontompent avant d'avoir le temps de les explorer mieux. L'objectif de ce projet est de développer un système capable de donner des conseils et des opinions en temps quasi-réel sur tout ce que vous demandez. L'assistant ultime pourra être accessible à partir de tout microphone autorisé à l'intérieur de votre maison ou de votre téléphone, il devrait s'exécuter constamment en arrière-plan et lorsqu'il est invoqué devrait pouvoir générer des réponses significatives (avec une voix badass) ainsi que l'interface avec le PC ou un serveur et enregistrer / lire / écrire des fichiers qui peuvent être accessibles plus tard. Il devrait être en mesure d'exécuter des recherches, de rassembler du matériel à partir d'Internet (extraire le contenu des pages HTML, transcrire des vidéos YouTube, trouver des articles scientifiques ...) et fournir des résumés qui peuvent être utilisés comme contexte pour prendre des décisions éclairées. De plus, il pourrait s'interfacer avec certains gadgets externes (IoT), mais c'est plus.

Démo:

2023-04-11.23-20-03_trim.mp4

Mise à jour du 14 juillet 2023: mode de recherche

Je peux partager Finnaly le premier projet du mode de recherche. Cette modalité a été pensée pour les gens qui traitent souvent des documents de recherche.

Passez au mode de recherche en disant «Passez au mode de recherche»
Initialisez un nouvel espace de travail comme celui-ci: «Initialisez un nouvel espace de travail sur les applications de fibre de carbone dans l'industrie des vaisseaux spatiaux» . Un espace de travail est un dossier qui recueille et organise les résultats de la recherche. Ce protocole est subdivisé en 3 sous-routines:
1. Identification de l'article de base: utilisez l' API chercheur sémantique pour identifier certains articles fortement pertinents;
2. Expansion du noyau: pour chaque article, trouve certaines suggestions, puis ne gardez que les suggestions qui semblent être similaires à au moins 2 papier;
3. EXPANSION REFY: Utilisez le package de suggestions Refy pour agrandir les résultats;
Trouvez des suggestions comme: 'Trouvez des suggestions qui sont sililaires au journal avec le titre ...' '
Télécharger: 'Télécharger le journal avec le titre ...'
Interrogez votre base de données comme: "Quel est l'auteur du journal avec titre ...?" «Quelles sont les conditions expérimentales fixées pour le journal avec le titre ...?

PS: Ce mode n'est pas super stable et doit être travaillé sur

PPS: Ce projet sera interrompu pendant un certain temps car je travaillerai sur ma thèse jusqu'en 2024. Cependant, il y a déjà tellement de choses qui peuvent être améliorées, donc je reviendrai!

Ce dont vous aurez besoin:

CLAUSE DE NON-RESPONSABILITÉ:
Le projet pourrait consommer votre crédit OpenAI, ce qui a entraîné une facturation indésirable;
Je ne prends la responsabilité d'aucune accusation indésirable;
Envisagez de fixer des limites à la consommation de crédit sur votre compte OpenAI;

Un compte Openai et une clé API; (Vérifiez les FAQ ci-dessous pour les alternatives)
Compte PicoVoice et un AccessKey gratuit; (facultatif)
Compte ElevenLabs et clé API gratuite (facultative) ;
Langchain API Keys for Web Surfing (News, Weather, Serpapi, Google-Serp, Google-Search ... Ils sont tous gratuits)
ffmpeg;
Python Virtual Environment (Python> = 3,9 et <3.10);
Un crédit à dépenser sur le chatppt (vous pouvez obtenir trois mois d'utilisation gratuite en vous inscrivant à Openai) (suggéré) ;
Version CUDA> = 11.2;
Un compte cloud IBM pour exploiter leurs modèles de texte vocale basés sur le cloud (tutoriel) (facultatif) ;
Une connexion Internet (raisonnablement) rapide (la majeure partie du code s'appuie sur l'API afin qu'une connexion plus lente puisse entraîner une période plus longue pour répondre);
micro et haut-parleur;
CUDA Capable Graphic Engine (My Torch Version: 2.0 et CUDA V11.7 pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117 );
Patience ?

Vous pouvez compter sur la nouvelle setup.bat qui fera la plupart des choses pour vous.

Aperçu de GitHub

Script principal Vous devez exécuter: openai_api_chatbot.py Si vous souhaitez utiliser la dernière version de l'API OpenAI dans le dossier Demos, vous trouverez des conseils pour les packages utilisés dans le projet, si vous avez des erreurs, vous pouvez d'abord vérifier ces fichiers pour cibler le problème. Maisant principalement dans le dossier Assistant: get_audio.py stocke toutes les fonctions pour gérer les interactions micro, tools.py implémente certains aspects de base de l'assistant virtuel, voice.py décrit une classe vocale (très). Agents.py Gire la partie Langchain du système (ici, vous pouvez ajouter ou supprimer des outils des boîtes à outils des agents)
Les scripts restants sont complémentaires à la génération de voix et ne doivent pas être modifiés.

Tutoriel d'installation

Installation automatique

Vous pouvez exécuter setup.bat si vous exécutez sur Windows / Linux. Le script effectuera chaque étape de l'installation manuelle en séquence. Reportez-vous à ceux-ci dans le cas où la procédure devrait échouer.
L'installation automatique exécutera également l'installation de Vicuna (Guide d'installation de Vicuna)

Installation manuelle

Étape 1: Installation, comptes, API ...

Environnement

Faites un nouvel environnement virtuel vide avec Python 3.8 et activez-le (. VENV_NAME SCRIPTS Activate);
pip install -r venv_requirements.txt ; Cela pourrait prendre un certain temps; Si vous rencontrez des conflits sur des packages spécifiques, installez-les manuellement sans le ==<version> ;
Installez manuellement Pytorch selon votre version CUDA;
Copiez et collez les fichiers que vous trouverez dans le dossier whisper_edits dans le dossier whisper de votre environnement (. VENV lib site-Packages Whisper ) Ces modifications ajouteront juste un attribut au modèle Whisper pour accéder plus facilement à sa dimension;
installer TTS;
Exécutez leur script et vérifiez que tout fonctionne (il devrait télécharger certains modèles) (vous pouvez également exécuter demos/tts_demo.py );
Renommer ou supprimer le dossier TTS et télécharger l'assistant et d'autres scripts à partir de ce référentiel
Installez Vicuna en suivant les instructions sur le dossier Vicuna ou en fonctionnant:
cd Vicuna
call vicuna.ps1
Les instructions manuelles vous demanderont de suivre le guide d'installation de Vicuna
Collez toutes vos clés dans le fichier env.txt et renommez-la à .env (oui, supprimez l'extension txt)
Vérifiez que tout fonctionne (suivant)

Chèques

Vérifiez que votre moteur graphique et votre version CUDA sont compatibles avec Pytorch en exécutant torch.cuda.is_available() et torch.cuda.get_device_name(0) à l'intérieur de pyhton; .
Exécutez tests.py . Ce fichier tente d'effectuer des opérations de base qui pourraient augmenter les erreurs;
[AVERTISSEMENT] Vérifiez les FAQ ci-dessous si vous avez des erreurs;
Vous pouvez vérifier les sources d'erreur en exécutant des démos dans le dossier Demos;

Étape 2: Support linguistique

Pour avoir des réponses parlées dans votre langue, vous devez d'abord vérifier si votre langue est prise en charge par le générateur de discours à https://cloud.ibm.com/docs/text-to-speech?topic=text-to-disech-voices ;
S'il est pris en charge, ajoutez ou modifiez les langues à l'intérieur VirtualAssistant.__init__() ;

N'oubliez pas: le murmure chargé est le moyen. S'il fonctionne mal dans votre langue, passez à la plus grande dans le __main__() sur whisper_model = whisper.load_model("large") ; Mais j'espère que votre mémoire GPU est également importante.

Étape 3: Running ( `openai_api_chatbot.py` ):

Lors de l'exécution, vous verrez beaucoup d'informations affichées. Je m'efforce constamment d'améliorer la lisibilité de l'exécution, l'ensemble du projet est une énorme version bêta, pardonne de légères variations des écrans ci-dessous. Quoi qu'il en soit, c'est ce qui se passe en termes généraux lorsque vous appuyez sur «Run»:

Les initialisations préliminaires ont lieu, vous devriez entendre un carillon lorsque l'assistant est prêt;
En attente de déclenchement de mots , vous devrez dire que Jarvis invoque l'assistant. À ce stade, une conversation commencera et vous pouvez parler dans la langue que vous voulez (si vous avez suivi l'étape 2). La conversation se terminera lorsque vous 1) dire un mot d'arrêt 2) dire quelque chose avec un mot (comme 'ok') 3) lorsque vous cessez de poser des questions pendant plus de 30 secondes

Une fois le mot magique dit, le mot écoute ... devrait alors apparaître. À ce stade, vous pouvez faire votre question. Lorsque vous avez terminé, attendez (3 secondes) pour que la réponse soit soumise;
Le script convertira l'audio enregistré en texte à l'aide de Whisper;
Le texte sera analysé et une décision sera prise. Si l'assistant estime qu'il doit prendre des mesures pour répondre (comme chercher une conversation passée), les agents de Langchain feront un plan et utiliseront leur outil pour répondre.
Sinon, le script élargira ensuite le chat_history avec votre question, il enverra une demande avec l'API et il mettra à jour l'historique dès qu'il recevra une réponse complète de Chatgpt (cela peut prendre jusqu'à 5 à 10 secondes, envisagez de demander explicitement une réponse courte si vous êtes pressé);
La fonction say() effectuera la duplication vocale pour parler avec la voix de Jarvis / quelqu'un; Si l'argument n'est pas en anglais, IBM Watson enverra la réponse de l'un de leurs beaux modèles de texte vocale. Si tout échoue, les fonctions s'appuieront sur PYTTSX3 qui est une alternative rapide mais pas aussi cool;

Lorsque l'un des mots clés d'arrêt est dit, le script demandera à Chatgpt de donner un titre à la conversation et enregistrera le chat dans un fichier .txt avec le format 'currentdate_title.txt';
L'assistant se rendra alors endormir;

J'ai fait quelques invites et fermé la conversation

Mots-clés:

Pour arrêter ou enregistrer le chat, dites simplement «merci» à un moment donné;
Pour invoquer la voix de Jarvis, dites simplement «Jarvis» à un moment donné;

pas idéal je sais mais fonctionne pour le moment

Histoire:

Travaille actuellement sur:

Étendre les outils de traitement des documents
Trouvez une alternative gratuite pour les agents de Langchain

Correction du bug de la longueur du chat (lorsque le chat est trop long, il ne peut pas être traité par Chatgpt 3.5 Turbo)
Mémoire en expansion
Crash Rapports
Affiner les capacités

En attente de chatppt4 à:

Ajouter une entrée multimodale (c'est-à-dire "pensez-vous que" ce "[tenant un avion en papier] pourrait voler" -> Camera -> ChatGpt4 -> "Vous devez améliorer la pointe des ailes")
Étendez la mémoire du projet aux images, PDF, papiers ...

Vérifiez le UpdateHistory.md du projet pour plus d'informations.

Amusez-vous!

Erreurs et FAQ

Catégories: installer, général, runtime

Installation: J'ai des packages contradictoires lors de l'installation de Venv_Requirements.txt , que dois-je faire?

Assurez-vous d'avoir la bonne version Python (3.7) sur le .venv (> python --version avec l'environnement virtuel activé).
Essayez de modifier le venv_requirements.txt et supprimez les exigences de la version des dépendances incriminées.
Supprimez le package du fichier TXT et installez-les manuellement par la suite.

Installation: Je rencontre une erreur lors de l'exécution d'Openai_API_CHATBOT.py Says: TypeError: LoadLibrary () L'argument 1 doit être STR, pas ce qui ne va pas?

Le problème est préoccupant Whisper. Vous devriez le réinstaller manuellement avec pip install whisper-openai

Installation: je ne peux pas importer 'openai.embeddings_utils'

Essayez pip install --upgrade openai .
Cela se produit parce que OpenAI a élevé leurs exigences minimales. J'ai eu ce problème et résolu en téléchargeant manuellement les embeddings_utils.py à l'intérieur ./<your_venv>/lib/site-packages/openai/

3. Si le problème persiste avec `` Datalib '', soulevez un problème et je vous fournirai le fichier manquant 4. Passez à Python 3.8 (créez un nouvel Env et réinstaller TTS, exigences)

Installation: je rencontre le modulenotFounonError d'erreur: aucun module nommé «<quelque module>»

Les exigences ne sont pas mises à jour à chaque engagement. Bien que cela puisse générer des erreurs, vous pouvez rapidement installer les modules manquants, en même temps, il empêche l'environnement des conflits lorsque j'essaie de nouveaux packages (et j'en essaie beaucoup)

Temps d'exécution: je rencontre une mémoire OOM lors du chargement du modèle Whisper, qu'est-ce que cela signifie?

Cela signifie que le modèle que vous avez sélectionné est trop grand pour la mémoire de votre périphérique CUDA. Malheureusement, vous ne pouvez pas y faire grand-chose, sauf charger un modèle plus petit. Si le modèle plus petit ne vous satisfait pas, vous voudrez peut-être parler «plus clair» ou faire des invites plus longues pour permettre au modèle de prédire plus précisément ce que vous dites. Cela semble gênant mais, dans mon cas, a grandement amélioré mon anglophone :)

Temps d'exécution: les jetons max de longueur pour ChatGPT-3.5-turbo sont 4096 mais reçus ... jetons.

C'est un bug toujours présent, ne vous attendez pas à avoir des conversations toujours longues avec votre assistant car il aura simplement suffisamment de mémoire pour se souvenir de toute la conversation à un moment donné. Un correctif est en développement, il pourrait consister à adopter une approche de «fenêtres coulissantes» même si elle peut provoquer la répétition de certains concepts.

Général: J'ai terminé mon crédit / démo OpenAI, que puis-je faire?

Aller en ligne uniquement. Le prix n'est pas si mauvais et vous pourriez finir par payer quelques dollars par mois, car le prix dépend de l'utilisation (avec des tests lourds, j'ai fini par consommer l'équivalent d'environ 4 dollars par mois pendant mon essai gratuit). Vous pouvez fixer des limites à la consommation mensuelle de jetons.
Utilisez un mode hybride où les tâches les plus à forte intensité de crédit sont exécutées localement gratuitement et le reste est effectué en ligne.
Installez Vicuna et exécutez le mode hors ligne uniquement avec des performances limitées.

Général: Pendant combien de temps ce projet sera-t-il mis à jour?

En ce moment (avril 2023), je travaille presque sans arrêt à ce sujet. Je vais probablement faire une pause en été parce que je vais travailler sur ma thèse.

Si vous avez des questions, vous pouvez me contacter en soulevant un problème et je ferai de mon mieux pour aider dès que possible.

Gianmarco Guarnier

Développer

Informations supplémentaires