Salesforce a rendu open source révolutionnaire son modèle d'IA multimodal xGen-MM, un outil puissant capable de comprendre et de générer simultanément plusieurs types de données tels que du texte et des images. Le modèle comporte 4 milliards de paramètres et a obtenu de bons résultats sur plusieurs tests de référence. Sa nature open source contraste avec les tendances actuelles du secteur et reflète l'engagement de Salesforce à promouvoir la recherche ouverte dans le domaine de l'IA. xGen-MM est unique dans sa capacité à traiter des « données entrelacées », ce qui lui permet d'effectuer des tâches plus complexes telles que répondre simultanément à des questions sur plusieurs images, avec un énorme potentiel d'application dans des domaines tels que le diagnostic médical et la conduite autonome.
Salesforce a lancé un ensemble de modèles d'IA multimodaux open source appelés xGen-MM. Cet ensemble de modèles peut comprendre et générer simultanément plusieurs types de données tels que du texte et des images, et peut complètement changer la façon dont nous recherchons et appliquons l'IA.
L'équipe de recherche Salesforce AI a publié un article sur arXiv détaillant le framework xGen-MM. Ce cadre comprend non seulement des modèles pré-entraînés, mais également des ensembles de données et du code de réglage fin. Il convient de mentionner que ce plus grand modèle possède 4 milliards de paramètres et que ses performances se sont bien comportées lors de plusieurs tests de référence, non inférieures à celles de modèles open source similaires.
Cette décision open source est complètement différente de la tendance actuelle de nombreux géants de la technologie choisissant de garder secrets les modèles d’IA avancés. Salesforce affirme espère promouvoir une recherche et un développement plus larges en ouvrant les modèles et les ensembles de données. En fait, cette décision vise également à donner à davantage de chercheurs et de développeurs la possibilité de participer à l’avancement de la technologie de l’IA multimodale.
L'une des innovations de xGen-MM est sa capacité à gérer des « données entrelacées », c'est-à-dire qu'il peut traiter plusieurs images et textes simultanément. Cette capacité permet au modèle d'effectuer des tâches plus complexes, comme répondre à des questions sur plusieurs images en même temps, ce qui est vraiment génial ! De tels scénarios d'application peuvent être d'une grande utilité dans des domaines tels que le diagnostic médical et la conduite autonome !
La version comprend également plusieurs versions optimisées du modèle, telles qu'un modèle de base pré-entraîné, un modèle configuré pour suivre les instructions et un modèle « optimisé pour la sécurité » conçu pour réduire les sorties nocives. Cette sélection diversifiée reflète l’importance croissante accordée par la communauté de l’IA à l’équilibre entre les capacités et l’éthique de la sécurité.
Cependant, la publication de modèles puissants a également déclenché des discussions sur les risques potentiels et les impacts sociaux de systèmes d’IA plus avancés. Bien que Salesforce ait procédé à des ajustements de sécurité pour réduire les risques, la question de savoir comment équilibrer innovation et sécurité reste une question qui mérite réflexion.
Cette version open source de Salesforce offre aux chercheurs des outils précieux pour mieux comprendre et améliorer ces technologies puissantes. Dans le même temps, cela constitue également une nouvelle référence en matière de transparence dans le domaine de l’IA, ce qui pourrait pousser d’autres géants de la technologie à être plus ouverts dans leurs recherches.
Entrée du modèle : https://huggingface.co/collections/Salesforce/xgen-mm-1-models-662971d6cecbf3a7f80ecc2e
Souligner:
xGen-MM est un ensemble de modèles d'IA multimodaux open source lancés par Salesforce qui prennent en charge une compréhension et une génération complètes de texte et d'images.
Le modèle a la capacité de traiter des données entrelacées et peut répondre à des questions sur plusieurs images en même temps, ce qui lui confère de larges perspectives d'application.
? Cette version comprend une variété de versions optimisées, prête attention aux questions de sécurité et d'éthique et fournit de riches ressources aux chercheurs.
Dans l'ensemble, le logiciel open source xGen-MM de Salesforce constitue une avancée majeure dans le domaine de l'IA. Il fournit non seulement des outils puissants, mais constitue également un exemple pour une direction de recherche et de développement en IA plus ouverte et plus responsable. ses applications futures et son développement dans divers domaines.