Google は、従来の画像生成方法を完全に変える、Whisk と呼ばれる新しい AI 画像生成ツールを発表しました。これまでの長いテキスト説明の必要性とは異なり、Whisk を使用すると、ユーザーは生成された画像のテーマ、シーン、スタイルを指定するためのプロンプトワードとして画像を直接アップロードできます。ユーザーはこれら 3 つの側面ごとに複数の画像を提供でき、Whisk はこれらの視覚情報を巧みに統合して予期しない画像を生成します。適切な画像がない場合でも、Whisk にはランダムな画像生成機能もあり、ユーザーはすぐに作成を開始できます。
Googleは、Whiskと呼ばれる新しいAIツールをリリースした。これは従来の画像生成モデルを覆し、ユーザーが長いテキスト説明の代わりに画像をプロンプトワードとして使用できるようにする。
Whisk では、AI が生成した画像のテーマ、シーン、スタイルを指定して画像をアップロードでき、それぞれに複数の画像を使用できます。
たとえば、豚の写真と猫の写真を入力し、イラストのスタイルを選択して、プロンプトの単語を入力しませんでした (もちろん、同時にテキスト プロンプトを使用することも選択できます)。 、自動的にこのようなレンダリングが生成されました。もちろん、私のようにキャラクターの絵を入力する必要がある場合は、SCENE が自動的に合成して生成するので、あまり関係ないかもしれませんが、予期しない驚きがあることに注意してください。
適切な画像が手元にない場合は、サイコロのアイコンをクリックすると、Google がいくつかの画像をプロンプトとして自動的に入力します (これらの画像も AI によって生成されているようです)。
私が何気なくクリックすると、Google は犬、ボート、刺繍の写真をランダムに表示し、その混合物がどのような効果を生み出すかを確認しました。
3枚の絵の要素が見事に融合して、面白い刺繍絵が出来上がっていますよ~。
画像をクリックすると、Whisk が生成された画像ごとにテキストのヒントも提供することがわかりました。結果に満足した場合は、画像を保存またはダウンロードできます。さらに最適化したい場合は、テキスト ボックスにテキストを追加するか、画像を直接クリックしてテキスト プロンプトを編集できます。
Googleはブログ投稿の中で、Whiskは「ピクセル精度の編集ではなく、迅速な視覚的探索」を目的として設計されていると強調した。同社はまた、Whisk は「軌道から外れる」可能性があるため、ユーザーが基礎となるプロンプトの単語を編集できるようにすると述べている。
Whisk ツールを数分間試してみましたが、非常に興味深いものであることがわかりました。画像の生成には少し面倒な数秒かかり、結果として得られる画像が少し奇妙に見えることもありますが、反復プロセスは楽しいものです。
Googleによると、WhiskはImagen3画像生成モデルの最新バージョンを使用しており、これも今日正式にリリースされたという。 Googleはまた、新世代のビデオ生成モデルVeo2をリリースした。これは「映画の独特の言語」を理解でき、余分な指などのアーチファクトが「少ない」と言われている。 Veo2 はまず Google の VideoFX でリリースされ、ユーザーは Google Labs の待機リストを通じて試用を申し込むことができ、来年には YouTube ショートやその他の製品にも拡大する予定です。
全体として、Whisk の登場は画像生成に新たな可能性をもたらし、ユーザーが視覚的な手段を通じて創造性を表現し、画像のパーソナライズされたカスタマイズをより簡単に実現できるようになりました。
製品体験アドレス:https://top.aibase.com/tool/whisk
Whisk は、革新的な画像生成方法により、より直感的で便利な画像作成体験をユーザーに提供するので、試してみる価値があります。 急いでリンクにアクセスして、この強力な AI ツールを体験してください。