El editor de Downcodes informó: OpenAI lanzó la revolucionaria tecnología de generación de imágenes de IA sCM, que ha logrado avances revolucionarios en la velocidad y eficiencia de la generación de imágenes y puede considerarse un hito en el campo de las imágenes de IA. Al simplificar los pasos de cálculo, el modelo sCM logra el efecto mágico de generar imágenes de alta calidad en solo dos pasos y es 50 veces más rápido que el modelo de difusión tradicional. Solo se necesitan 0,11 segundos para generar una imagen en la GPU A100 y los parámetros máximos del modelo alcanzan los 1.500 millones, estableciendo un nuevo récord en la industria. Esta tecnología no solo logró excelentes resultados de prueba en los conjuntos de datos CIFAR-10 e ImageNet, sino que también mostró un fuerte potencial de expansión, sentando una base sólida para el entrenamiento de modelos a mayor escala en el futuro.
Ventajas técnicas principales:
Genere imágenes de alta calidad en solo dos pasos de cálculo
Solo se necesitan 0,11 segundos para generar una imagen en la A100GPU
En comparación con el modelo de difusión tradicional, la velocidad aumenta 50 veces.
Los parámetros máximos del modelo alcanzaron los 1.500 millones, estableciendo un nuevo récord
En pruebas reales, sCM tuvo un desempeño impresionante. Logró una puntuación FID de 2,06 en el conjunto de datos CIFAR-10 y una puntuación excelente de 1,88 al generar imágenes de 512x512 píxeles en ImageNet. Estas métricas están sólo un 10% por detrás de los mejores modelos de difusión existentes, pero representan un salto cualitativo en velocidad.
La clave de la innovación tecnológica es resolver los problemas fundamentales del modelo de consistencia tradicional. Los modelos anteriores utilizaban pasos de tiempo discretos, que no sólo requerían parámetros adicionales sino que también eran propensos a errores. El equipo de investigación de OpenAI unificó varios métodos estableciendo un marco teórico simplificado e identificó y resolvió con éxito las principales causas de la inestabilidad del entrenamiento.
Lo que es aún más interesante es que esta tecnología muestra un fuerte potencial de expansión. OpenAI entrenó con éxito un modelo con 1.500 millones de parámetros en el conjunto de datos de ImageNet, que es la primera vez que se utiliza un modelo similar. El estudio encontró que a medida que aumenta el tamaño del modelo, la calidad de la imagen continúa mejorando, lo que significa que en el futuro puede ser posible un entrenamiento de modelos a mayor escala.
La llegada de la tecnología SCM presagia una nueva ola de desarrollo en el campo de la generación de imágenes de IA. Su enorme mejora en velocidad y eficiencia brindará posibilidades para más escenarios de aplicación. Esperemos y veamos qué traerá OpenAI en el futuro. ¡descubrimiento!