Die unverzichtbare Ressource für alle, die mit der OpenAI Vision API experimentieren und darauf aufbauen möchten. Dieses Repository dient als Drehscheibe für innovative Experimente und präsentiert eine Vielzahl von Anwendungen, die von einfachen Bildklassifizierungen bis hin zu fortschrittlichen Zero-Shot-Lernmodellen reichen. Es ist ein Ort für Anfänger und Experten, um die Möglichkeiten der Vision API zu erkunden, ihre Erkenntnisse auszutauschen und gemeinsam daran zu arbeiten, die Grenzen der visuellen KI zu erweitern.
Für das Experimentieren mit der OpenAI-API ist eine API erforderlich. Hier können Sie eins bekommen.
Experiment | ergänzende Materialien | Autoren |
---|---|---|
WebcamGPT – Chat mit Videostream | @SkalskiP | |
HotDogGPT – einfache Bildklassifizierungsanwendung | @SkalskiP | |
Zero-Shot-Bildklassifizierer mit GPT-4V | @capjamesg | |
Zero-Shot-Objekterkennung mit GroundingDINO + GPT-4V | @capjamesg | |
GPT-4V vs. CLIP | @capjamesg | |
GPT-4V mit Set-of-Mark (SoM) | Jianwei Yang, Hao Zhang, Feng Li, Xueyan Zou, Chunyuan Li, Jianfeng Gao | |
GPT-4V im Web | @Jiayi-Pan | |
Automatisiertes Voiceover des NBA-Spiels | @SkalskiP | |
Screenshot-to-Code | @abi | |
GPT mit Sehtest | Roboflow-Team |
Wir würden uns über Ihre Hilfe freuen, dieses Repository noch besser zu machen! Unabhängig davon, ob Sie ein neues Experiment hinzufügen möchten oder Verbesserungsvorschläge haben, können Sie jederzeit ein Problem oder eine Pull-Anfrage eröffnen.
Wenn Sie der Aufgabe gewachsen sind und ein neues Experiment hinzufügen möchten, schauen Sie sich bitte unseren Beitragsleitfaden an. Dort finden Sie alle Informationen, die Sie benötigen.