IA générative avec LLM
Dans l'IA générative avec de grands modèles linguistiques (LLM), vous apprendrez les principes fondamentaux du fonctionnement de l'IA générative et comment la déployer dans des applications du monde réel.
En suivant ce cours, vous apprendrez à :
- Comprendre en profondeur l'IA générative, en décrivant les étapes clés d'un cycle de vie typique de l'IA générative basée sur LLM, depuis la collecte de données et la sélection de modèles, jusqu'à l'évaluation et le déploiement des performances.
- Décrire en détail l'architecture du transformateur qui alimente les LLM, comment ils sont formés et comment le réglage fin permet d'adapter les LLM à une variété de cas d'utilisation spécifiques.
- Utilisez des lois d'échelle empiriques pour optimiser la fonction objectif du modèle en fonction de la taille de l'ensemble de données, du budget de calcul et des exigences d'inférence.
- Appliquez des méthodes de formation, de réglage, d'inférence, d'outils et de déploiement de pointe pour maximiser les performances des modèles dans le cadre des contraintes spécifiques de votre projet.
- Discutez des défis et des opportunités que l'IA générative crée pour les entreprises après avoir entendu les témoignages de chercheurs et de praticiens de l'industrie.
Les développeurs qui ont une bonne compréhension de base du fonctionnement des LLM, ainsi que des meilleures pratiques derrière leur formation et leur déploiement, seront en mesure de prendre de bonnes décisions pour leur entreprise et de créer plus rapidement des prototypes fonctionnels. Ce cours aidera les apprenants à développer une intuition pratique sur la meilleure façon d'utiliser cette nouvelle technologie passionnante.
Semaine 1
Cas d'utilisation de l'IA générative, cycle de vie du projet et pré-formation du modèle
Objectifs d'apprentissage
- Discutez de la pré-formation du modèle et de la valeur de la pré-formation continue par rapport à la mise au point.
- Définir les termes IA générative, grands modèles de langage, invite et décrire l'architecture du transformateur qui alimente les LLM
- Décrire les étapes d'un cycle de vie typique d'un modèle d'IA générative basé sur LLM et discuter des facteurs contraignants qui déterminent les décisions à chaque étape du cycle de vie du modèle.
- Discutez des défis informatiques lors de la pré-formation du modèle et déterminez comment réduire efficacement l'empreinte mémoire
- Définir le terme loi de mise à l'échelle et décrire les lois qui ont été découvertes pour les LLM liées à la taille de l'ensemble de données d'entraînement, au budget de calcul, aux exigences d'inférence et à d'autres facteurs.
Lab 1 – Cas d'utilisation de l'IA générative : Résumer le dialogue
Quiz de la semaine 1
Semaine 2
Affiner et évaluer de grands modèles de langage
Objectifs d'apprentissage
- Décrire comment le réglage fin des instructions à l'aide d'ensembles de données d'invite peut améliorer les performances sur une ou plusieurs tâches
- Définir l’oubli catastrophique et expliquer les techniques qui peuvent être utilisées pour le surmonter
- Définir le terme réglage fin efficace sur les paramètres (PEFT)
- Expliquer comment le PEFT diminue le coût de calcul et surmonte les oublis catastrophiques
- Expliquer comment le réglage fin des instructions à l'aide d'ensembles de données rapides peut augmenter les performances LLM sur un ou plusieurs
Lab 2 - Affiner un modèle d'IA génératif pour la synthèse des dialogues
Quiz de la semaine 2
Semaine 3
Apprentissage par renforcement et applications basées sur le LLM
Objectifs d'apprentissage
- Décrire comment RLHF utilise les commentaires humains pour améliorer les performances et l'alignement des grands modèles de langage
- Expliquer comment les données recueillies auprès des étiqueteurs humains sont utilisées pour former un modèle de récompense pour le RLHF
- Définir la chaîne de pensée et décrire comment elle peut être utilisée pour améliorer les capacités de raisonnement et de planification des LLM.
- Discutez des défis auxquels les LLM sont confrontés en raison des limites de connaissances et expliquez comment les techniques de récupération et d'augmentation de l'information peuvent surmonter ces défis.
Lab 3 - Affiner FLAN-T5 avec l'apprentissage par renforcement pour générer des résumés plus positifs
Quiz de la semaine 3