Des chercheurs de l'Université chinoise de Hong Kong et de SmartMore ont développé conjointement un cadre innovant de modèle de langage visuel (VLM) appelé Mini-Gemini. Ce cadre permet d'obtenir d'excellents résultats au-delà des modèles existants dans plusieurs tests de référence zéro-shot grâce à un système à double encodeur et à une technologie d'exploration d'informations sur les correctifs. Mini-Gemini démontre une grande efficacité et une grande précision lors du traitement de tâches visuelles et textuelles complexes, ce qui indique que la technologie VLM a fait des progrès significatifs dans le traitement de tâches complexes et fournit également une nouvelle direction pour le développement futur du domaine de l'IA. Son architecture efficace et ses performances puissantes en font une étape importante dans le domaine du VLM.
Des chercheurs de l'Université chinoise de Hong Kong et de SmartMore ont introduit un nouveau cadre appelé Mini-Gemini pour faire progresser le développement des VLM grâce à un système à double encodeur et à une technologie d'exploration d'informations de correctifs. Le Mini-Gemini fonctionne bien sur plusieurs benchmarks zéro tir, surpassant les modèles existants. Ce cadre adopte un système à double encodeur, une exploration d'informations sur les correctifs et des ensembles de données de haute qualité pour promouvoir le développement de VLM. Mini-Gemini fait preuve d'efficacité et de précision dans la gestion de tâches visuelles et textuelles complexes. Le champ d'application et les performances du modèle Gemini sont constamment élargis, montrant un grand potentiel dans le domaine de l'IA.
L'émergence du framework Mini-Gemini marque une nouvelle avancée dans la technologie des modèles de langage visuel. Son architecture efficace et ses excellentes performances lors des tests de référence ont jeté une base solide pour l'application future du VLM dans davantage de domaines, et ont également donné un nouvel élan au développement continu de la technologie de l'intelligence artificielle. On pense que Mini-Gemini et ses versions améliorées ultérieures joueront un rôle important dans des applications plus pratiques à l'avenir.