안정성 AI는 대형 텍스트-이미지 생성 모델의 세 가지 버전의 일련의 안정적인 확산 3.5의 출시를 발표합니다. 이 시리즈는 다양한 컴퓨팅 기능 및 응용 프로그램 시나리오에 맞게 다양한 매개 변수 척도 및 성능 특성 모델을 제공함으로써 연구원에서 엔터프라이즈 고객에 이르기까지 광범위한 요구를 충족시키는 것을 목표로합니다. 이 업데이트는 안정적인 확산 3.0의 이전 단점에 응답하고 시장의 다른 주요 AI 이미지 생성 도구와 경쟁하기위한 것입니다.
안정성 AI는 최근 최신 딥 러닝 텍스트-이미지 생성 모델-안정적인 확산 3.5를 출시했습니다. 이 릴리스에는 연구원, 기업 고객 및 애호가를 포함한 다양한 사용자의 요구를 충족시키기 위해 설계된 세 가지 개선 된 오픈 소스 모델이 포함됩니다.
그 중에서도 안정적인 확산 3.5large는 전체 시리즈에서 가장 강력한 모델이며 매개 변수는 81 억에 이릅니다. 탁월한 이미지 품질과 프롬프트에 대한 응답 성이 뛰어난이 모델은 전문 사용자에게 이상적이며 최대 1 메가 픽셀의 해상도로 고품질 이미지를 생성 할 수 있습니다.
또한 안정적인 확산 3.5large 터보는 안정적인 확산 3.5large의 단순화 된 버전입니다. 고품질 이미지를 생성하면 속도가 크게 향상됩니다.
또 다른 새로운 모델은 25 억 개의 매개 변수를 가진 안정적인 확산 3.5medium입니다. 이 모델은 개선 된 MMDIT-X 아키텍처 및 교육 방법을 채택하여 "Out Of the Box"로 설계되었으며 소비자 하드웨어에서도 원활하게 실행됩니다. 이미지 생성 품질과 사용자 정의 용이성 사이의 균형이 잘 잡혀 0.25 ~ 2 메가 픽셀 이미지를 생성합니다.
이 릴리스의 배경은 6 월에 안정적인 확산 3Medium의 릴리스 후 기대치를 충족시키지 못한 후 안정성 AI가보다 변형적인 솔루션을 시작하기로 결정했다는 것입니다. 이 회사는 Openai의 Dall-E 및 Midjourney와 같은 플랫폼의 도전에 대처하기 위해 업데이트로 시장 경쟁력을 되찾기를 희망한다고 말했다.
새로운 모델에서 중요한 기술 혁신은 쿼리 키 정규화 기술의 도입입니다. 이 혁신은 프롬프트에 대한 모델의 사용자 정의와 응답 성을 향상 시키며, 사용자는 명확한 프롬프트로보다 일관된 결과를 얻을 수 있으며 더 넓은 프롬프트를 사용할 때 더 풍부한 이미지 해석을 얻을 수 있습니다.
안정적인 확산 3.5 시리즈 모델은 Stability AI의 커뮤니티 라이센스에 따라 릴리스되므로 사용자는 비상장적으로 무료로 사용할 수 있습니다. 동시에 연간 소득이 1 백만 달러 미만인 단체는 상업용으로 무료로 사용될 수 있으며 초과 소득을 가진 사용자는 회사 라이센스를 신청해야합니다.
모든 모델과 자조 주택 무게는 포옹 얼굴 및 안정성 AI의 API에 제공됩니다. 또한 고급 이미지 사용자 정의 옵션을 제공하는 Controlnets 기능은 앞으로 며칠 안에 출시 될 것으로 예상됩니다.
공식 입구 :
https://stability.ai/stable-image
포옹 페이스 포털의 세 가지 버전 :
https://huggingface.co/stability/stable-diffusion-3.5-large
https://huggingface.co/stableai/stable-diffusion-3.5-large-turbo
https://huggingface.co/stability/stable-diffusion-3.5-medium
핵심 사항 :
새로 출시 된 안정적인 확산 3.5는 다양한 사용자 요구를 충족시키기 위해 세 가지 모델 버전을 제공합니다.
안정적인 확산 3.5LARGE TURBO는 빠른 생성에 적합한 이미지 생성 속도가 빠릅니다.
새로운 모델은 쿼리 키 정규화 기술을 소개하여 사용자 정의 및 응답 성을 향상시킵니다.
요컨대, 안정적인 확산 3.5 시리즈 모델의 출시는 텍스트-이미지 생성 분야에서 안정성 AI의 주요 업그레이드와 사용자 경험을 더욱 향상시키고 자리를 차지할 것으로 예상됩니다. 치열한 시장 경쟁에서. 제공된 링크를 방문하고 새로운 이미지 생성 기술을 경험하십시오!