Apple a récemment mis en open source une technologie d'édition d'images multimodale guidée par un grand langage appelée MGIE. Cette technologie est conçue pour simplifier le processus d'édition d'images et améliorer l'efficacité. Grâce aux instructions en langage naturel, les utilisateurs peuvent facilement apporter diverses modifications aux images, telles que changer la couleur, redimensionner, etc., sans nécessiter une expertise complexe. MGIE a démontré ses résultats lors de la conférence ICLR'24, et sa commodité et son intelligence ont apporté de nouvelles idées dans le domaine du traitement d'images. Adresse du projet : https://top.aibase.com/tool/mgie, les développeurs intéressés sont invités à visiter.
Apple a mis en open source une technologie d'édition multimodale guidée par un modèle de grand langage appelée MGIE pour simplifier le processus d'édition d'images grâce à des instructions en langage naturel. Utilisez des MLLM pour générer des instructions d'édition d'images et obtenez des résultats à l'adresse du projet ICLR'24 : https://top.aibase.com/tool/mgie. La technologie MGIE peut non seulement éditer des images via des instructions, mais également réaliser diverses modifications, telles que le changement de couleur et le redimensionnement, fournissant ainsi de nouvelles idées intelligentes et intuitives pour le traitement des images.L'open source de MGIE apporte de nouvelles possibilités dans le domaine de l'édition d'images et fournit de précieuses ressources d'apprentissage aux développeurs. Je pense qu'avec le développement continu de la technologie, MGIE jouera un rôle plus important dans le domaine du traitement d'image, offrant aux utilisateurs une expérience d'édition d'image plus pratique et plus intelligente. À l’avenir, nous pouvons nous attendre à la mise en œuvre et à l’application de MGIE dans davantage de scénarios d’application.