Erforschen Sie den Kurs "Procope Engineering for Vision Models", um Ihr Verständnis von schnellen technischen Techniken sowohl in Text- als auch in Vision -Modellen zu verbessern. In diesem Kurs werden Sie verschiedene Visionsmodelle effektiv erfordern und feststellen.
In diesem Kurs befassen Sie sich mit dem Bereich der schnellen Engineering für Visionsmodelle und untersuchen Techniken, um Modelle wie das Meta-Segment What Model (SAM), OWL-VIT und stabile Diffusion 2.0 fordern. Folgendes werden Sie lernen:
Bildgenerierung : Schnellvisionsmodelle mit Text und passen Sie Hyperparameter an, um Bilder mit den gewünschten Eigenschaften zu generieren.
Bildsegmentierung : Verwenden Sie positive oder negative Koordinaten zusammen mit den Koordinaten des Begrenzungsfelds, um Modelle für eine präzise Bildsegmentierung fordern.
Objekterkennung : Verwenden Sie natürliche Sprachaufforderungen, um Begrenzungsboxen zu erzeugen und bestimmte Objekte in Bildern zu isolieren.
In-Lackierung : Kombinieren Sie die Objekterkennung, Bildsegmentierung und Bildgenerierungstechniken, um Objekte in Bildern durch generierten Inhalt zu ersetzen.
Personalisierung mit Feinabstimmung : Feinabstellungsdiffusionsmodelle, um benutzerdefinierte Bilder basierend auf bereitgestellten Bildern von Personen oder Orten zu generieren, unter Verwendung einer Technik namens Dreambooth.
Iterating und Experimentverfolgung : Erfahren Sie, wie Experimente mithilfe von Comet effektiv verfolgt werden, eine Bibliothek, die die Optimierung der visuellen Eingabeaufforderungs -Engineering -Workflows unterstützt.
Eingabeaufentwicklungsmodelle mit Text, Koordinaten und Begrenzungsboxen, die Hyperparameter für die gewünschten Ausgangseigenschaften abstellen.
? Verwenden Sie In-Mainting, um Teile von Bildern durch generierte Inhalte zu ersetzen und verschiedene Sehmodelltechniken zu kombinieren.
Fein-Tun-Diffusionsmodelle für die präzise Bildgenerierung, einschließlich der Personalisierung mit benutzerdefinierten Bildern.
Verfolgen Sie die Experimente effizient mit Comet und optimieren Sie Ihre visuellen Workflows für Engineering.
Abby Morgan , Jacques Verré und Caleb Kaiser sind erfahrene Ingenieure des maschinellen Lernens im Comet und bringen ihr Know -how durch, um Sie durch die Feinheiten des Sehmodells zu führen.
Für die Einschreibung und weitere Details finden Sie in DeepLearning.ai.