A Apple recentemente abriu o código-fonte de uma tecnologia multimodal de edição de imagens guiada por modelo em linguagem grande, chamada MGIE. Essa tecnologia foi projetada para simplificar o processo de edição de imagens e melhorar a eficiência. Através de instruções em linguagem natural, os usuários podem facilmente fazer diversas modificações nas imagens, como mudança de cor, redimensionamento, etc., sem a necessidade de conhecimentos complexos. MGIE demonstrou seus resultados na conferência ICLR'24, e sua conveniência e inteligência trouxeram novas ideias para o campo do processamento de imagens. Endereço do projeto: https://top.aibase.com/tool/mgie, desenvolvedores interessados podem visitar.
A Apple abriu o código-fonte de uma tecnologia multimodal de edição guiada por modelo em linguagem grande, chamada MGIE, para simplificar o processo de edição de imagens por meio de instruções em linguagem natural. Use MLLMs para gerar instruções de edição de imagens e obtenha resultados no endereço do projeto ICLR'24: https://top.aibase.com/tool/mgie. A tecnologia MGIE pode não apenas editar imagens por meio de instruções, mas também realizar diversas modificações, como mudança de cor e redimensionamento, fornecendo novas ideias inteligentes e intuitivas para processamento de imagens.O código aberto do MGIE traz novas possibilidades para o campo da edição de imagens e fornece valiosos recursos de aprendizagem para desenvolvedores. Acredito que com o desenvolvimento contínuo da tecnologia, o MGIE desempenhará um papel mais importante na área de processamento de imagens, proporcionando aos usuários uma experiência de edição de imagens mais conveniente e inteligente. No futuro, podemos esperar a implementação e aplicação do MGIE em mais cenários de aplicação.