A Apple lançou recentemente seu modelo básico multimodal em grande escala MM1, com um tamanho de parâmetro de 30 bilhões e uma arquitetura especialista híbrida (MoE). Vale ressaltar que mais da metade dos membros da equipe de pesquisa e desenvolvimento do modelo são chineses, o que reflete a importante contribuição dos cientistas chineses na área de inteligência artificial. O MM1 teve um bom desempenho em testes de benchmark multimodais, indicando que a Apple fez um grande avanço no campo da inteligência artificial generativa e pode estabelecer uma base sólida para o desenvolvimento futuro de produtos. Ele usa uma variante do MoE e lidera em indicadores de pré-treinamento e vários testes de benchmark multimodais. Os pesquisadores também verificaram a importância da arquitetura do modelo e da seleção de dados de pré-treinamento por meio de vários experimentos de ablação.
A Apple lançou um modelo básico multimodal em grande escala chamado MM1 com 30 bilhões de parâmetros, usando arquitetura MoE, e mais da metade dos autores são chineses. Este modelo é de grande importância no campo multimodal e pode anunciar o lançamento de produtos relacionados pela Apple no futuro. A Apple aumentou o seu investimento na área da inteligência artificial generativa, demonstrando a sua determinação em fazer progressos significativos. O MM1 adota a variante do MoE e lidera em indicadores de pré-formação e vários testes de referência multimodais. Os pesquisadores exploraram a importância da arquitetura do modelo e da seleção de dados pré-treinamento por meio de vários experimentos de ablação.O lançamento do MM1 marca um passo importante para a Apple no campo da inteligência artificial. Seu poderoso desempenho e a contribuição da equipe chinesa merecem atenção. No futuro, podemos esperar que a Apple lance produtos e serviços mais inovadores baseados no MM1 para promover ainda mais o desenvolvimento e aplicação de tecnologia de inteligência artificial multimodal.