Explorez le cours "ingénierie rapide pour les modèles de vision", conçu pour améliorer votre compréhension des techniques d'ingénierie rapides dans les modèles de texte et de vision. Ce cours vous permettra d'inviter et affiner efficacement divers modèles de vision.
Dans ce cours, vous vous plongerez dans le domaine de l'ingénierie rapide pour les modèles de vision, explorant des techniques pour prompter des modèles comme le modèle de segment de Meta tout (SAM), Owl-Vit et STABLE Diffusion 2.0. Voici ce que vous apprendrez:
Génération d'images : modèles de vision rapide avec du texte et ajuster les hyperparamètres pour générer des images avec les caractéristiques souhaitées.
Segmentation de l'image : utilisez des coordonnées positives ou négatives, ainsi que des coordonnées de boîte de délimitation, pour provoquer des modèles pour une segmentation d'image précise.
Détection d'objets : utilisez des invites en langage naturel pour produire des boîtes de délimitation, isolant des objets spécifiques dans les images.
Intégrande : combinez la détection d'objets, la segmentation d'images et les techniques de génération d'images pour remplacer les objets dans les images par du contenu généré.
Personnalisation avec réglage fin : modèles de diffusion affinés pour générer des images personnalisées basées sur des images fournies de personnes ou de lieux, en utilisant une technique appelée Dreambooth.
Itération et suivi des expériences : Apprenez à suivre les expériences efficacement à l'aide de la comète, une bibliothèque qui aide à optimiser les flux de travail d'ingénierie invite visuels.
Modèles de vision rapides avec texte, coordonnées et boîtes de délimitation, réglage des hyperparamètres pour les caractéristiques de sortie souhaitées.
? Utilisez la peinture pour remplacer des parties d'images par du contenu généré, en combinant diverses techniques de modèle de vision.
Modèles de diffusion affinés pour une génération d'images précises, y compris la personnalisation avec des images personnalisées.
Suivez les expériences efficacement à l'aide de la comète, en optimisant vos workflows d'ingénierie invite visuels.
Abby Morgan , Jacques Verré et Caleb Kaiser sont des ingénieurs d'apprentissage automatique chevronnés de la comète, apportant leur expertise pour vous guider à travers les subtilités de l'ingénierie rapide du modèle de vision.
Pour l'inscription et les détails supplémentaires, visitez Deeplearning.ai.