O recurso obrigatório para quem deseja experimentar e desenvolver a API OpenAI Vision. Este repositório serve como um centro para experimentos inovadores, apresentando uma variedade de aplicações que vão desde classificações simples de imagens até modelos avançados de aprendizagem zero-shot. É um espaço para iniciantes e especialistas explorarem os recursos da API Vision, compartilharem suas descobertas e colaborarem para ampliar os limites da IA visual.
Experimentar a API OpenAI requer uma API?. Você pode conseguir um aqui.
experimentar | materiais complementares | autores |
---|---|---|
WebcamGPT - converse com stream de vídeo | @SkalskiP | |
HotDogGPT - aplicativo simples de classificação de imagens | @SkalskiP | |
classificador de imagem zero-shot com GPT-4V | @capjamesg | |
detecção de objeto zero-shot com GroundingDINO + GPT-4V | @capjamesg | |
GPT-4V versus CLIP | @capjamesg | |
GPT-4V com conjunto de marca (SoM) | Jianwei Yang, Hao Zhang, Feng Li, Xueyan Zou, Chunyuan Li, Jianfeng Gao | |
GPT-4V na web | @Jiayi-Pan | |
narração automática do jogo da NBA | @SkalskiP | |
captura de tela para código | @abi | |
GPT com exame de visão | Equipe Robofluxo |
Adoraríamos sua ajuda para tornar este repositório ainda melhor! Se você deseja adicionar um novo experimento ou tem alguma sugestão de melhoria, sinta-se à vontade para abrir um problema ou pull request.
Se você estiver à altura da tarefa e quiser adicionar um novo experimento, consulte nosso guia de contribuição. Lá você encontrará todas as informações que precisa.