Google은 최근 최신 이미지 생성 모델 인 Imagen3이 이제 Gemini API를 통해 개발자에게 열렸다고 발표했습니다. 이 모델에는 강력한 이미지 생성 기능이있을뿐만 아니라 입력 텍스트 큐를 기반으로 다양한 예술 스타일로 이미지를 생성하며 초현실주의에서 애니메이션 캐릭터에 이르기까지 다양한 영역을 다룹니다.
Imagen3은 사용하기가 매우 간단합니다. 개발자는 API를 통해 텍스트 설명 만 제출하면 고품질 이미지를 빠르게 생성합니다. 이미지 당 생성 비용은 $ 0.03으로 배치 이미지 생성이 필요한 개발자 및 비즈니스에 적합합니다. 이러한 합리적인 가격 책정 전략을 통해 Google은 창의적인 작업의 임계 값을 낮추고 더 많은 사람들이 AI가 가져온 예술적 창조의 재미를 즐길 수 있도록하는 것을 목표로합니다.
Imagen3은 이미지를 생성 할 때 뛰어난 능력을 보여줍니다. 섬세한 색상이든 복잡한 세부 사항이든, 모델은 사용자의 아이디어를 정확하게 실현할 수 있습니다. 사용자 경험을 향상시키기 위해 Imagen3은 향상된 프롬프트 추적 기능을 도입했습니다. 예를 들어, 동물의 외관과 배경을 설명하면 모델은 사용자의 창의적인 요구를 충족시키기 위해 매우 적합한 이미지를 생성 할 수 있습니다.
또한 Imagen3은 이미지 생성의 저작권 및 오용을 고려합니다. 생성 된 각 이미지에는 SynthID라는 보이지 않는 디지털 워터 마크가 제공됩니다. 이 워터 마크는 육안으로 인식 할 수 없지만 특수 기술을 통해 AI에 의해 이미지를 생성 할 수 있도록 허위 정보의 위험과 부적절한 사용을 효과적으로 억제 할 수 있습니다.
또한 개발자가 Imagen3 사용을 시작하는 것은 매우 쉽습니다. 간단한 Python 코드 예제를 통해 사용자는 API와 빠르게 상호 작용하여 좋아하는 이미지를 생성 할 수 있습니다. Google은 향후보다 생성적인 모델을 Gemini API에 연결할 계획이므로 개발자는 창의적인 제품의 다양 화를 주도하기 위해보다 대화 형 콘텐츠를 만들 수 있습니다.
Google은 생성 미디어 및 언어 모델의 조합을 적극적으로 탐색하고 있으며 향후 애플리케이션 시나리오가 더욱 광범위 할 것이며 개발자는 이러한 기술을 사용하여 컨텐츠 생성 및 도구 개발의 잠재력을 실현할 수 있습니다.
문서 : https://ai.google.dev/gemini-api/docs/imagen-prompt-guide?hl=zh-cn
Google의 움직임은 AI 기술의 애플리케이션 및 개발을 더욱 촉진하여 더 많은 개발자와 기업이 AI가 가져온 편의성과 혁신을 즐길 수 있습니다.