Stability AI anuncia el lanzamiento de Medium de difusión 3.5 estable, una nueva herramienta gratuita de pintura comercial de IA, que una vez más lidera la innovación de la tecnología de pintura de IA. Con su alto rendimiento y un umbral bajo, este modelo trae capacidades avanzadas de pintura de IA al público, realmente dándose cuenta de la visión de "todos pueden usar". Adopta un diseño de parámetros de 2.5 mil millones a optimizado, que requiere solo 9.9 GB de memoria de video para ejecutarse sin problemas, rompiendo las limitaciones de hardware de los usuarios comunes y reduciendo en gran medida el umbral para la pintura de IA.
La estabilidad AI una vez más rompe las barreras técnicas y lanza el nuevo modelo de difusión de 33 años. Esta herramienta de pintura de IA para el público no solo es completamente gratuita y abierta para uso comercial, sino que lo más importante es que logra un equilibrio perfecto entre el alto rendimiento y la popularización.
Este modelo, que adopta la arquitectura del convertidor de difusión multimodal (MMDIT-X), tiene un diseño simplificado de 2.5 mil millones de parámetros, resuelve hábilmente el problema del umbral de hardware de los usuarios comunes. Con solo 9.9 GB de memoria de video, puede ejecutarse sin problemas en la mayoría de las tarjetas gráficas de grado de consumo, realmente dándose cuenta de la visión de "todos pueden usarse".
En términos de innovación tecnológica, el modelo integra tres codificadores de texto previamente capacitados e introduce la tecnología de estandarización de QK para mejorar la estabilidad de la capacitación. Vale la pena mencionar que el diseño del módulo de doble atención en sus primeras 12 capas de transformación ha mejorado significativamente el modelo en términos de calidad de imagen, efecto de diseño y comprensión rápida compleja.
El proceso de capacitación del modelo combina datos sintéticos con datos públicos seleccionados y adopta una estrategia de capacitación híbrida con una mejora de la resolución progresiva, asegurando la diversidad y la calidad de las imágenes generadas. En comparación con modelos medianos similares, muestra ventajas obvias en el efecto de generación de imágenes y la velocidad de procesamiento.
Sin embargo, los usuarios deben prestar atención a algunos detalles durante el uso: las palabras rápidas excesivamente largas pueden causar defectos en el borde de la imagen; Al mismo tiempo, debe tenerse en cuenta que, debido a las diferencias en la distribución de los datos de capacitación, las mismas palabras rápidas pueden producir diferentes efectos creativos.
El lanzamiento de este modelo no solo proporciona herramientas de creación de IA convenientes para creadores y nuevas empresas individuales, sino que también refleja la determinación de AI de estabilidad para promover la popularización de la tecnología AI. Ya sea que se use para la creación artística o el desarrollo educativo, traerá la posibilidad de la creación de IA a una base de usuarios más amplia.
Dirección de descarga del modelo: https://huggingface.co/stabilityai/stable-diffusion-3.5-medium
La aparición de la difusión estable 3.5 Medio marca la etapa de la tecnología de pintura de IA se vuelve más popular y fácil de usar. Su naturaleza comercial gratuita y sus bajos requisitos de hardware abrirán la puerta a la creación artística de IA para más personas y promoverán la aplicación y el desarrollo de la tecnología de IA en varios campos.