téléchargement hands on llms - téléchargement hands on llms

hands on llms

Autre code source

1.0.0

Télécharger

Cours pratique de LLM

Apprenez à former et à déployer un conseiller financier en temps réel

de Paul Iusztin, Pau Labarta Bajo et Alexandru Razvant

Table des matières

1. Éléments de base
- 1.1. Pipeline de formation
- 1.2. Pipeline de streaming en temps réel
- 1.3. Pipeline d'inférence
- 1.4. Ensemble de données de questions et réponses financières
2. Configurer les services externes
- 2.1. Alpaga
- 2.2. Qdrant
- 2.3. Comète ML
- 2.4. Faisceau
- 2.5. AWS
3. Installation et utilisation
4. Conférences
- 4.1. Frais
- 4.2. Poser des questions
- 4.3. Conférences vidéo
- 4.4. Articles
5. Licence
6. Contributeurs et enseignants

1. Éléments de base

En utilisant la conception à 3 pipelines, c'est ce que vous apprendrez à construire dans ce cours ↓

1.1. Pipeline de formation

Pipeline de formation qui :

charge un ensemble de données Q&A propriétaire
peaufine un LLM open source à l'aide de QLoRA
enregistre les expériences de formation sur le suivi d'expériences de Comet ML et les résultats d'inférence sur le tableau de bord LLMOps de Comet ML
stocke le meilleur modèle dans le registre des modèles de Comet ML

Le pipeline de formation est déployé à l'aide de Beam comme infrastructure GPU sans serveur.

-> Trouvé dans le répertoire modules/training_pipeline .

Configuration matérielle minimale requise

Processeur : 4 cœurs
RAM : 14 Gio
VRAM : 10 Gio (GPU Nvidia compatible CUDA obligatoire)

Remarque : Ne vous inquiétez pas si vous ne disposez pas de la configuration matérielle minimale requise. Nous vous montrerons comment déployer le pipeline de formation sur l'infrastructure sans serveur de Beam et y former le LLM.

1.2. Pipeline de streaming en temps réel

Pipeline de fonctionnalités en temps réel qui :

ingère les nouvelles financières d’Alpaca
nettoie et transforme les documents d'actualité en intégrations en temps réel à l'aide de Bytewax
stocke les intégrations dans la base de données Qdrant Vector

Le pipeline de streaming est automatiquement déployé sur une machine AWS EC2 à l'aide d'un pipeline CI/CD intégré aux actions GitHub.

-> Trouvé dans le répertoire modules/streaming_pipeline .

Configuration matérielle minimale requise

Processeur : 1 cœur
RAM : 2 Gio
VRAM : -

1.3. Pipeline d'inférence

Pipeline d'inférence qui utilise LangChain pour créer une chaîne qui :

télécharge le modèle affiné à partir du registre des modèles de Comet
prend les questions des utilisateurs en entrée
interroge la base de données Qdrant Vector et améliore l'invite avec des actualités financières associées
appelle le LLM affiné pour des conseils financiers en utilisant la requête initiale, le contexte de la base de données vectorielle et l'historique des discussions
conserve l'historique des discussions en mémoire
enregistre l'invite et la réponse dans la fonction de surveillance LLMOps de Comet ML

Le pipeline d'inférence est déployé à l'aide de Beam en tant qu'infrastructure GPU sans serveur, en tant qu'API RESTful. En outre, il est intégré dans une interface utilisateur à des fins de démonstration, implémentée dans Gradio.

-> Trouvé dans le répertoire modules/financial_bot .

Configuration matérielle minimale requise

Processeur : 4 cœurs
RAM : 14 Gio
VRAM : 8 Gio (GPU Nvidia compatible CUDA obligatoire)

Remarque : Ne vous inquiétez pas si vous ne disposez pas de la configuration matérielle minimale requise. Nous allons vous montrer comment déployer le pipeline d'inférence sur l'infrastructure sans serveur de Beam et appeler le LLM à partir de là.

architecture

1.4. Ensemble de données de questions et réponses financières

Nous avons utilisé GPT3.5 pour générer un ensemble de données financières de questions-réponses afin d'affiner notre LLM open source afin de nous spécialiser dans l'utilisation de termes financiers et la réponse aux questions financières. L'utilisation d'un grand LLM, tel que GPT3.5 pour générer un ensemble de données qui entraîne un plus petit LLM (par exemple, Falcon 7B) est connue sous le nom de réglage fin avec distillation .

→ Pour comprendre comment nous avons généré l'ensemble de données financières de questions-réponses, consultez cet article rédigé par Pau Labarta.

→ Pour voir une analyse complète de l'ensemble de données financières de questions-réponses, consultez la sous-section dataset_analysis du cours rédigé par Alexandru Razvant.

AED

2. Configurer les services externes

Avant de plonger dans les modules, vous devez configurer quelques outils externes supplémentaires pour le cours.

REMARQUE : Vous pouvez les configurer au fur et à mesure pour chaque module, car nous vous indiquerons dans chaque module ce dont vous avez besoin.

2.1. Alpaga

financial news data source

Suivez ce document pour vous montrer comment créer un compte GRATUIT et générer les clés API dont vous aurez besoin dans ce cours.

Remarque : 1x connexion de données Alpaca est GRATUITE.

2.2. Qdrant

serverless vector DB

Accédez à Qdrant et créez un compte GRATUIT.

Ensuite, suivez ce document pour savoir comment générer les clés API dont vous aurez besoin dans ce cours.

Remarque : nous utiliserons uniquement le plan freemium de Qdrant.

2.3. Comète ML

serverless ML platform

Accédez à Comet ML et créez un compte GRATUIT.

Ensuite, suivez ce guide pour générer une CLÉ API et un nouveau projet, dont vous aurez besoin dans le cours.

Remarque : nous utiliserons uniquement le plan freemium de Comet ML.

2.4. Faisceau

serverless GPU compute | training & inference pipelines

Accédez à Beam et créez un compte GRATUIT.

Ensuite, vous devez suivre leur guide d'installation pour installer leur CLI et la configurer avec vos informations d'identification Beam.

Pour en savoir plus sur Beam, voici un guide d'introduction.

Remarque : Vous disposez d’environ 10 heures de calcul gratuites. Ensuite, vous ne payez que ce que vous utilisez. Si vous disposez d'un GPU Nvidia > 8 Go de VRAM et que vous ne souhaitez pas déployer les pipelines de formation et d'inférence, l'utilisation de Beam est facultative.

Dépannage

Lors de l’utilisation de Poetry, nous avons eu des problèmes pour localiser la CLI Beam dans un environnement virtuel Poetry. Pour résoudre ce problème, après avoir installé Beam, nous créons un lien symbolique qui pointe vers les binaires de Poetry, comme suit :

 export COURSE_MODULE_PATH= < your-course-module-path > # e.g., modules/training_pipeline
 cd $COURSE_MODULE_PATH
 export POETRY_ENV_PATH= $( dirname $( dirname $( poetry run which python ) ) )

 ln -s /usr/local/bin/beam ${POETRY_ENV_PATH} /bin/beam

2.5. AWS

cloud compute | feature pipeline

Accédez à AWS, créez un compte et générez une paire d'informations d'identification.

Ensuite, téléchargez et installez leur AWS CLI v2.11.22 et configurez-le avec vos informations d'identification.

Remarque : vous ne paierez que ce que vous utilisez. Vous déployerez uniquement une VM t2.small EC2, ce qui ne coûte que ~$0.023 /heure. Si vous ne souhaitez pas déployer le pipeline de fonctionnalités, l'utilisation d'AWS est facultative.

3. Installation et utilisation

Chaque module a ses dépendances et ses scripts. Dans une configuration de production, chaque module aurait son référentiel, mais dans ce cas d'utilisation, à des fins d'apprentissage, nous mettons tout au même endroit :

Ainsi, consultez le README pour chaque module individuellement pour voir comment l'installer et l'utiliser :

q_and_a_dataset_generator
pipeline_de_formation
streaming_pipeline
inférence_pipeline

4. Conférences

Nous vous encourageons fortement à cloner ce référentiel et à reproduire tout ce que nous avons fait pour tirer le meilleur parti de ce cours.

Dans les conférences vidéo, les articles et la documentation README de chaque module, vous trouverez des instructions étape par étape.

Bon apprentissage !

4.1. Frais

Le code GitHub (publié sous licence MIT) et les conférences vidéo (publiées sur YouTube) sont entièrement gratuits. Le sera toujours.

Les leçons Medium sont publiées sous le mur payant de Medium. Si vous l'avez déjà, ils sont gratuits. Sinon, vous devez payer des frais mensuels de 5 $ pour lire les articles.

4.2. Poser des questions

Si vous avez des questions ou des problèmes pendant le cours, nous vous encourageons à créer un numéro dans ce référentiel où vous pourrez expliquer en profondeur tout ce dont vous avez besoin.

Sinon, vous pouvez également contacter les professeurs sur LinkedIn :

Paul Iusztin
Paul Labarta