Googleの最新の画像生成モデルImagen3は、Gemini APIでオンラインになり、開発者に強力な画像生成ツールを提供しています。このモデルは、シュールレアリスムからアニメのキャラクターに至るまで、さまざまなユーザーの創造的なニーズを満たす、さまざまなスタイルで高品質の画像を生成することができます。 Imagen3は、画像の明確さと構成を改善するだけでなく、ユーザーが単純化されたテキストプロンプトを使用して創造性を画像に変換するのにも役立ちます。
初期段階では、Imagen3は有料ユーザーにのみ開放され、すぐに無料のユーザーに徐々に起動されると予想されます。公式の紹介によると、ユーザーは画像あたり0.03ドルを支払うことによってのみ、Imagen3の強力な機能を享受できます。同時に、画像を生成するとき、ユーザーは画像のアスペクト比と、さまざまなニーズを満たすために生成されたオプションの数を自由に制御できます。
虚偽の情報と誤った争いに対処するために、Imagen3によって生成されたすべての画像には、画像によって生成された作品が人工知能として生成された作品を認識する目に見えないデジタルウォーターマークSynthidが含まれています。さらに、開発者はPythonコードを介して画像生成を簡単に達成でき、特定のコードの例も公式ドキュメントで提供されています。ユーザーは、APIキーを設定して迅速な単語を入力して、この新しいテクノロジーの利便性を体験するだけで、必要な画像を生成できます。
ユーザーにImagen3の機能をよりよく理解できるようにするために、オフィシャルは、さまざまなスタイルとテーマをカバーする一連の生成された画像サンプルも示しました。テクノロジーの継続的な進歩により、Googleは近い将来、より生成的なメディアモデルをGemini APIに統合し、生成メディアモデルと言語モデルの組み合わせをさらに促進し、開発者がより興味深いアプリケーションの作成を支援することを計画しています。
ブログ:https://developers.googleblog.com/en/imagen-3-arrives-in-the-gemini-api/
キーポイント:
Imagen3はGemini APIで利用可能になり、さまざまなスタイルで高品質の画像生成サービスを提供しています。
画像生成あたりのコストは0.03ドルで、ユーザー定義のアスペクト比と生成オプションがサポートされています。
生成されたすべての画像には、誤った情報の拡散を防ぐために、目に見えない透かしが装備されています。
Imagen3の発売は、Googleの生成メディアのもう1つの大きなブレークスルーをマークし、開発者とクリエイティブワーカーにより多くの可能性を提供します。