El equipo de investigación del Instituto de Inteligencia Artificial de Beijing ha lanzado un nuevo modelo de generación de imágenes OmniGen, que rompe la limitación de función única de las herramientas tradicionales de generación de imágenes. A diferencia de modelos como Stable Diffusion, OmniGen integra múltiples funciones como la generación de texto a imagen y la edición de imágenes bajo un marco unificado, lo que lo convierte en un "todoterreno". El editor de Downcodes explicará en detalle el poder de OmniGen y sus perspectivas de aplicación.
Recientemente, el equipo de investigación del Instituto de Inteligencia Artificial de Beijing lanzó un nuevo modelo de generación de imágenes llamado OmniGen.
Reproductor completo de generación y edición de imágenes.
En comparación con herramientas de generación de imágenes anteriores, como Stable Diffusion, lo más destacado de OmniGen es que ya no se centra únicamente en una sola tarea, sino que tiene múltiples capacidades:
Puede manejar una variedad de tareas de generación de imágenes bajo un marco unificado: desde texto hasta generación de imágenes y edición de imágenes.
Esto significa que los usuarios solo necesitan proporcionar palabras simples para controlar la generación de imágenes y la edición precisa, y ya no necesitan usar complementos como ControlNet e IP-Adapter para ajustar los detalles de la imagen.
Aquí AIbase se basa en dar una palabra de aviso de efecto detallado para fotografía creativa con una cámara antigua. El efecto general generado está lleno de detalles y el efecto es el siguiente:
En múltiples pruebas, OmniGen tuvo un desempeño impresionante, a la par de los modelos más avanzados del mercado para la generación de texto a imagen. En el punto de referencia GenEval, OmniGen usó solo 100 millones de imágenes para el entrenamiento, mientras que SD3 usó más de mil millones de imágenes.
Las capacidades de edición de imágenes son igualmente excelentes, con la capacidad de controlar con precisión las imágenes originales y las instrucciones de edición. Por ejemplo, en el equipo de prueba EMU-Edit, supera a modelos conocidos como InstructPix2Pix, e incluso es comparable al actual modelo EMU-Edit de última generación.
En la tarea de generación basada en temas, OmniGen ha demostrado extraordinarias capacidades de personalización y es adecuado para muchos campos, como la creación de arte y el diseño publicitario.
Dirección de prueba: https://huggingface.co/spaces/Shitao/OmniGen
Documento: https://arxiv.org/html/2409.11340v1
OmniGen aporta nuevos avances al campo de la generación de imágenes con sus potentes funciones y rendimiento eficiente. Su método de operación simple y fácil de usar también reduce el umbral para la generación de imágenes y brinda a más usuarios herramientas creativas convenientes. Se espera que OmniGen tenga aplicaciones más amplias en el futuro y promueva un mayor desarrollo de la tecnología de generación de imágenes con inteligencia artificial.