El editor de Downcodes se enteró de que Stability AI ha lanzado su último y más potente modelo de generación de imágenes, Stable Diffusion 3.5. Este modelo no es una versión única, sino que contiene tres versiones para satisfacer las necesidades de diferentes usuarios, desde investigadores científicos hasta usuarios empresariales. puede beneficiarse de ello. Estas tres versiones tienen diferente énfasis en la cantidad de parámetros, la velocidad de ejecución y el hardware aplicable, brindando a los usuarios una gama más amplia de opciones.
Ayer por la tarde, Stability AI lanzó su modelo más potente: Stable Diffusion 3.5. Este no es solo un modelo único, sino un grupo familiar que contiene tres versiones, diseñado para satisfacer a todos, desde investigadores científicos hasta entusiastas de los negocios.
Las tres versiones son Stable Diffusion3.5Large, Stable Diffusion3.5Large Turbo y Stable Diffusion3.5Medium, que se lanzarán el 29 de octubre.
Stable Diffusion3.5Large es un modelo base de 8 mil millones de parámetros conocido por su excelente calidad de imagen y precisión de palabras clave, lo que lo hace ideal para uso profesional y capaz de producir imágenes con una resolución de hasta 1 megapíxel.
Stable Diffusion3.5Large Turbo es una versión destilada del primero, que es capaz de generar imágenes de alta calidad en solo 4 pasos, mucho más rápido que Stable Diffusion3.5Large.
Stable Diffusion3.5Medium tiene 2.500 millones de parámetros, utiliza una arquitectura MMDiT-X mejorada y un método de entrenamiento, está diseñado para ser plug-and-play, puede ejecutarse directamente en hardware de consumo, equilibra la calidad de la imagen y la personalización, y puede generar imágenes de resolución. con tasas entre 0,25 y 2 megapíxeles.
Estos modelos se desarrollaron teniendo como prioridad la personalización, integrando la normalización de clave de consulta en el bloque transformador, estabilizando el proceso de entrenamiento del modelo y simplificando un mayor ajuste y desarrollo. Para respaldar la flexibilidad en las tareas posteriores, Stability AI conserva una base de conocimientos más amplia y diversos estilos en el modelo, aunque esto puede generar una mayor incertidumbre en los resultados de salida.
El modelo Stable Diffusion3.5 sobresale en múltiples aspectos, incluida la personalización, el rendimiento eficiente y la diversidad de resultados. Estos modelos se pueden ajustar fácilmente para satisfacer necesidades de creación específicas o crear aplicaciones basadas en flujos de trabajo personalizados. También están optimizados para ejecutarse en hardware estándar de consumo sin requisitos de hardware excesivos. Además, estos modelos son capaces de crear imágenes que representan el mundo entero sin la necesidad de palabras extensas, al mismo tiempo que pueden generar imágenes en una variedad de estilos y estéticas como 3D, fotografía, pintura, arte lineal y prácticamente cualquier imagen visual. estilo imaginable.
Stability AI también enfatizó su compromiso con la seguridad, tomando medidas razonables para evitar el uso indebido de Stable Diffusion 3.5 y enfocándose en la integridad desde las primeras etapas de desarrollo. Además, la licencia comunitaria Stability AI es muy permisiva y permite a personas y organizaciones utilizar el modelo de forma gratuita para uso no comercial, incluida la investigación científica. El modelo también es gratuito para uso comercial por parte de nuevas empresas, pymes y creadores con ingresos anuales de hasta 1 millón de dólares. La propiedad de los medios resultantes no se ve afectada por licencias restrictivas.
El modelo Stable Diffusion3.5 ya está disponible para autohospedaje en Hugging Face, y el código de inferencia también es de código abierto. Además, se puede acceder al modelo a través de plataformas como Stability AI API, Replicate, ComfyUI y DeepInfra.
Dirección de la experiencia: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large
Con todo, los modelos de la serie Stable Diffusion 3.5 han logrado avances significativos en la calidad de la imagen, la velocidad de generación y la facilidad de uso, brindando a los usuarios potentes capacidades de generación de imágenes y escenarios de aplicación flexibles. El editor de Downcodes recomienda a todos los lectores que lo experimenten y sientan su poderoso rendimiento.