Apple a récemment publié son modèle de base multimodal à grande échelle MM1, avec une taille de paramètres de 30 milliards et une architecture hybride experte (MoE). Il convient de noter que plus de la moitié des membres de l’équipe de recherche et développement du modèle sont chinois, ce qui reflète l’importante contribution des scientifiques chinois dans le domaine de l’intelligence artificielle. MM1 a obtenu de bons résultats lors des tests de référence multimodaux, indiquant qu'Apple a réalisé une percée majeure dans le domaine de l'intelligence artificielle générative et pourrait jeter une base solide pour le développement futur de produits. Il utilise une variante du MoE et mène des indicateurs de pré-formation et de multiples tests de référence multimodaux. Les chercheurs ont également vérifié l'importance de l'architecture du modèle et de la sélection des données de pré-formation grâce à plusieurs expériences d'ablation.
Apple a publié un modèle de base multimodal à grande échelle appelé MM1 avec 30 milliards de paramètres, utilisant l'architecture MoE, et plus de la moitié des auteurs sont chinois. Ce modèle revêt une grande importance dans le domaine multimodal et pourrait annoncer le lancement futur de produits connexes par Apple. Apple a augmenté ses investissements dans le domaine de l'intelligence artificielle générative, démontrant sa détermination à réaliser des progrès significatifs. MM1 adopte la variante MoE et est leader en matière d'indicateurs de pré-formation et de multiples tests de référence multimodaux. Les chercheurs ont exploré l’importance de l’architecture du modèle et de la sélection des données de pré-entraînement à travers de multiples expériences d’ablation.La sortie de MM1 marque une étape importante pour Apple dans le domaine de l'intelligence artificielle. Ses performances puissantes et la contribution de l'équipe chinoise méritent l'attention. À l’avenir, nous pouvons nous attendre à ce qu’Apple lance des produits et services plus innovants basés sur MM1 afin de promouvoir davantage le développement et l’application de la technologie d’intelligence artificielle multimodale.