La ressource incontournable pour tous ceux qui souhaitent expérimenter et développer l'API OpenAI Vision. Ce référentiel sert de plateforme pour des expériences innovantes, présentant une variété d'applications allant de la simple classification d'images aux modèles avancés d'apprentissage zéro-shot. Il s'agit d'un espace permettant aux débutants et aux experts d'explorer les capacités de l'API Vision, de partager leurs découvertes et de collaborer pour repousser les limites de l'IA visuelle.
Expérimenter avec l'API OpenAI nécessite une API ?. Vous pouvez en obtenir un ici.
expérience | matériaux complémentaires | auteurs |
---|---|---|
WebcamGPT - discuter avec flux vidéo | @SkalskiP | |
HotDogGPT - application simple de classification d'images | @SkalskiP | |
classificateur d'images zéro tir avec GPT-4V | @capjamesg | |
détection d'objet zéro tir avec GroundingDINO + GPT-4V | @capjamesg | |
GPT-4V contre CLIP | @capjamesg | |
GPT-4V avec jeu de marques (SoM) | Jianwei Yang, Hao Zhang, Feng Li, Xueyan Zou, Chunyuan Li, Jianfeng Gao | |
GPT-4V sur le Web | @Jiayi-Pan | |
voix off automatisée du jeu NBA | @SkalskiP | |
capture d'écran en code | @abi | |
GPT avec examen de la vue | L'équipe Roboflow |
Nous serions ravis de votre aide pour rendre ce référentiel encore meilleur ! Que vous souhaitiez ajouter une nouvelle expérience ou avoir des suggestions d'amélioration, n'hésitez pas à ouvrir un problème ou une pull request.
Si vous êtes à la hauteur et souhaitez ajouter une nouvelle expérience, veuillez consulter notre guide de contribution. Vous y trouverez toutes les informations dont vous avez besoin.