Downcodes의 편집자는 Stability AI가 가장 강력한 최신 이미지 생성 모델인 Stable Diffusion 3.5를 출시했다는 사실을 알게 되었습니다. 이 모델은 단일 버전이 아니라 과학 연구원부터 기업 사용자까지 다양한 사용자의 요구를 충족하기 위해 세 가지 버전이 포함되어 있습니다. 그것으로부터 이익을 얻을 수 있습니다. 이 세 가지 버전은 매개변수 수량, 실행 속도 및 적용 가능한 하드웨어를 서로 다르게 강조하여 사용자에게 더 넓은 선택 범위를 제공합니다.
어제 저녁 Stability AI는 가장 강력한 모델인 Stable Diffusion 3.5를 출시했습니다. 이것은 단일 모델일 뿐만 아니라 과학 연구자부터 비즈니스 애호가까지 모든 사람을 만족시킬 수 있도록 설계된 세 가지 버전의 제품군입니다.
Stable Diffusion3.5Large, Stable Diffusion3.5Large Turbo, Stable Diffusion3.5Medium 세 가지 버전이 10월 29일 출시됩니다.
Stable Diffusion3.5Large는 뛰어난 이미지 품질과 큐 워드 정확도로 유명한 80억 매개변수 기본 모델로 전문가용으로 이상적이며 최대 1메가픽셀 해상도의 이미지를 생성할 수 있습니다.
Stable Diffusion3.5Large Turbo는 Stable Diffusion3.5Large보다 훨씬 빠른 4단계만으로 고품질 이미지를 생성할 수 있는 이전 버전의 정제된 버전입니다.
Stable Diffusion3.5Medium은 25억 개의 매개변수를 갖고 있으며 향상된 MMDiT-X 아키텍처 및 교육 방법을 사용하고 플러그 앤 플레이 방식으로 설계되었으며 소비자급 하드웨어에서 직접 실행할 수 있고 이미지 품질과 사용자 정의 가능성의 균형을 맞추고 해상도 이미지를 생성할 수 있습니다. 0.25~2메가픽셀 사이의 비율로 제공됩니다.
이러한 모델은 쿼리 키 정규화를 변환기 블록에 통합하고 모델 훈련 프로세스를 안정화하며 추가 미세 조정 및 개발을 단순화함으로써 사용자 정의 가능성을 최우선으로 두고 개발되었습니다. 다운스트림 작업의 유연성을 지원하기 위해 Stability AI는 모델에서 더 넓은 지식 기반과 다양한 스타일을 유지하지만 이로 인해 출력 결과의 불확실성이 높아질 수 있습니다.
Stable Diffusion3.5 모델은 사용자 정의 가능성, 효율적인 성능 및 다양한 출력을 포함한 여러 측면에서 탁월합니다. 이러한 모델은 특정 작성 요구 사항을 충족하거나 사용자 정의된 워크플로를 기반으로 애플리케이션을 구축하기 위해 쉽게 미세 조정할 수 있습니다. 또한 과도한 하드웨어 요구 사항 없이 표준 소비자급 하드웨어에서 실행되도록 최적화되었습니다. 또한 이러한 모델은 광범위한 프롬프트 단어 없이도 전 세계를 대표하는 이미지를 생성하는 동시에 3D, 사진, 페인팅, 라인 아트 및 거의 모든 시각적 요소와 같은 다양한 스타일과 미학으로 이미지를 생성할 수 있습니다. 상상할 수 있는 스타일.
Stability AI는 또한 Stable Diffusion 3.5의 오용을 방지하기 위한 합리적인 조치를 취하고 개발 초기 단계부터 무결성에 중점을 두는 등 보안에 대한 의지를 강조했습니다. 또한 Stability AI 커뮤니티 라이선스는 매우 관대하므로 개인과 조직이 과학 연구를 포함한 비상업적 용도로 무료로 모델을 사용할 수 있습니다. 또한 이 모델은 연간 수익이 최대 100만 달러에 달하는 스타트업, 중소기업 및 창작자가 상업적으로 무료로 사용할 수 있습니다. 결과 미디어의 소유권은 제한적 라이센스의 영향을 받지 않습니다.
Stable Diffusion3.5 모델은 이미 Hugging Face에서 자체 호스팅이 가능하며 추론 코드도 오픈 소스로 제공됩니다. 또한 Stability AI API, Replicate, ComfyUI, DeepInfra 등의 플랫폼을 통해 모델에 접근할 수 있습니다.
체험주소 : https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large
전체적으로 Stable Diffusion 3.5 시리즈 모델은 이미지 품질, 생성 속도 및 사용 편의성이 크게 향상되어 사용자에게 강력한 이미지 생성 기능과 유연한 적용 시나리오를 제공합니다. Downcodes의 편집자는 모든 독자가 이를 경험하고 강력한 성능을 느낄 것을 권장합니다.