El último modelo de IA de Stability AI, Stable Zero123, puede generar vistas de objetos 3D de alta calidad basadas en una sola imagen, y su rendimiento supera significativamente al modelo Zero123-XL de la generación anterior. La mejora de este modelo se refleja principalmente en tres aspectos: conjunto de datos de entrenamiento optimizado, tecnología innovadora de "condiciones elevadas" y un proceso de entrenamiento que es 40 veces más eficiente. Stable Zero123 se lanzó en la plataforma Hugging Face y ofrece dos modelos de licencia: versión de investigación y versión comercial, lo que brinda nuevas posibilidades al campo de la generación de objetos 3D. Este artículo explicará en detalle la tecnología central y las perspectivas de aplicación de Stable Zero123.
Stability AI ha lanzado un nuevo modelo de IA llamado Stable Zero123, que puede generar vistas de objetos 3D de alta calidad a partir de una sola imagen. Stable Zero123 supera significativamente a su predecesor Zero123-XL en los resultados producidos, gracias a tres innovaciones clave.
Stable Zero123 utiliza un conjunto de datos de entrenamiento rigurosamente seleccionado de Objaverse que retiene específicamente objetos 3D de alta calidad. Esta mejora garantiza que los objetos 3D generados sean más realistas.
Durante el proceso de entrenamiento e inferencia del modelo, Stable Zero123 utiliza el ángulo de cámara estimado para el "acondicionamiento de elevación". Esta tecnología permite que el modelo haga predicciones más precisas y mejora significativamente la calidad de las imágenes generadas. Stable Zero123 también presenta un conjunto de datos precalculado y un cargador de datos mejorado, lo que hace que el entrenamiento sea 40 veces más eficiente.
Stable Zero123 está actualmente lanzado en Hugging Face para que investigadores y usuarios no comerciales lo descarguen y experimenten. Cabe señalar que el uso de este modelo está sujeto a ciertas restricciones de autorización y se divide en dos versiones: Stable Zero123 y Stable Zero123C. El primero contiene algunos objetos 3D autorizados por CC-BY-NC y solo puede usarse con fines de investigación; el segundo solo usa objetos autorizados por CC-BY y CC0, lo que permite a los usuarios miembros de Stability AI usarlos comercialmente.
Además, Stable Zero123 también está integrado con el código fuente abierto threestudio para respaldar la investigación de código abierto sobre la generación de objetos 3D. Actualmente, la versión simplificada relacionada del proceso Stable3D se encuentra en versión preliminar privada. Con este enfoque, los usuarios pueden aprovechar el muestreo de destilación de puntuación (SDS) para optimizar los campos de radiación neuronal (NeRF) para construir modelos 3D con textura rica a partir de imágenes generadas por el modelo Stable Zero123.
El lanzamiento de Stable Zero123 no solo aporta un progreso tecnológico significativo al campo de la generación de objetos 3D, sino que también ofrece nuevas posibilidades para la investigación y las aplicaciones comerciales.
Blog oficial: https://stability.ai/news/stable-zero123-3d-generación
Reflejos:
Stable Zero123 puede generar vistas de objetos 3D de alta calidad basadas en una sola imagen, lo que mejora significativamente el efecto de generación.
El modelo permite una generación de imágenes más precisa a través de conjuntos de datos mejorados y técnicas de acondicionamiento mejoradas.
Stable Zero123 se divide en versión de investigación y versión comercial; esta última requiere membresía de Stability AI.
La aparición de Stable Zero123 marca un salto significativo en la tecnología de generación de modelos 3D. Su proceso de entrenamiento eficiente y sus efectos de generación de alta calidad brindan la posibilidad de más escenarios de aplicación en el futuro. Vale la pena esperar su mayor desarrollo y aplicación en varios campos. .