Apple et l'Université Cornell ont publié un modèle d'apprentissage automatique multimodal appelé "Ferret" en open source. Ferret a la capacité de localiser et de référencer avec précision des éléments dans les images, de comprendre les requêtes des utilisateurs et de donner des commentaires appropriés. Cette décision reflète l'attitude plus ouverte d'Apple dans le domaine de l'intelligence artificielle ainsi que son investissement et l'accent mis sur la recherche de pointe en matière d'IA. Cela a une signification positive pour promouvoir le développement de la technologie de l’IA et la construction de communautés open source, et indique que les modèles multimodaux auront des applications plus larges dans les domaines de la compréhension des images et de la recherche d’informations à l’avenir.
Apple et l'Université Cornell ont collaboré pour publier un modèle d'apprentissage automatique multimodal open source appelé « Ferret ». Ferret est un système qui peut référencer et positionner des éléments n'importe où dans une image, identifiant les éléments utiles dans les requêtes des utilisateurs et répondant de manière appropriée. Cette annonce montre l’attitude plus ouverte d’Apple à l’égard de ses travaux en matière d’IA et démontre son engagement en faveur d’une recherche percutante sur l’IA.
La version open source de Ferret fournit des ressources précieuses aux chercheurs et développeurs en intelligence artificielle et contribue à promouvoir le développement de l’apprentissage automatique multimodal. À l’avenir, nous espérons que Ferret jouera un rôle dans des scénarios d’application plus pratiques et offrira des services plus pratiques et plus intelligents aux utilisateurs.