Apple recientemente abrió una tecnología de edición de imágenes guiada por modelos de lenguaje grande multimodal llamada MGIE. Esta tecnología está diseñada para simplificar el proceso de edición de imágenes y mejorar la eficiencia. A través de instrucciones en lenguaje natural, los usuarios pueden realizar fácilmente diversas modificaciones en las imágenes, como cambiar el color, cambiar el tamaño, etc., sin necesidad de conocimientos complejos. MGIE demostró sus resultados en la conferencia ICLR'24 y su conveniencia e inteligencia han aportado nuevas ideas al campo del procesamiento de imágenes. Dirección del proyecto: https://top.aibase.com/tool/mgie, los desarrolladores interesados pueden visitarlo.
Apple ha abierto una tecnología de edición guiada por modelos de lenguaje grande multimodal llamada MGIE para simplificar el proceso de edición de imágenes a través de instrucciones en lenguaje natural. Utilice MLLM para generar instrucciones de edición de imágenes y obtuvo resultados en ICLR'24 Dirección del proyecto: https://top.aibase.com/tool/mgie. La tecnología MGIE no solo puede editar imágenes mediante instrucciones, sino también lograr diversas modificaciones, como cambiar el color y cambiar el tamaño, proporcionando nuevas ideas inteligentes e intuitivas para el procesamiento de imágenes.El código abierto de MGIE aporta nuevas posibilidades al campo de la edición de imágenes y proporciona valiosos recursos de aprendizaje para los desarrolladores. Creo que con el desarrollo continuo de la tecnología, MGIE desempeñará un papel más importante en el campo del procesamiento de imágenes, brindando a los usuarios una experiencia de edición de imágenes más conveniente e inteligente. En el futuro, podemos esperar la implementación y aplicación de MGIE en más escenarios de aplicación.