Google Labs は最近、画像ベースの AI アート生成ツール Whisk をリリースし、アート制作に新しい体験をもたらしました。テキスト プロンプトを備えた従来の画像生成ツールとは異なり、Whisk を使用すると、ユーザーはツール内で画像を直接アップロードまたは生成し、テーマ、シーン、スタイルを指定して、より直感的な芸術的創作を実現できます。ユーザーは、さまざまなコンポーネントを組み合わせたり、テキスト プロンプトを使用して微調整したりして、ユニークで創造的な芸術作品を作成できます。 Whisk の背後にあるテクノロジーは、Google の強力な言語モデルと画像生成モデルを組み合わせたもので、画像を単にコピーするのではなく、画像の本質的な特徴を捉えることができます。
Google Labsは最近、最新の生成人工知能実験ツールであるWhiskを米国で発売した。主にテキストプロンプトに依存する従来の画像生成ツールとは異なり、Whisk は入力方法として画像を使用することに重点を置いており、ユーザーがより直感的に芸術作品を作成できるようにします。
ユーザーは画像を Whisk に直接アップロードすることも、テーマ、シーン、スタイルなどの要素を指定してツール内で画像を生成することもできます。 Whisk システムを使用すると、ユーザーはこれらのコンポーネントを組み合わせたり、追加のテキスト プロンプトを使用して必要に応じて微調整したりできます。
注目に値するのは、Google の言語モデル (おそらく最近リリースされた Gemini 2.0 Flash) が舞台裏で、入力画像の詳細な説明を自動的に生成するということです。これらの記述は、Google の最新の画像生成モデル Imagen3 に入力され、正確なレプリカを作成するのではなく、被写体の本質的な特徴を捕捉します。
AIbase は、左側の 3 つの写真をアップロードした後、右側の結果を生成するために多くのテストを実施しました。その効果は非常に優れており、プレイアビリティは非常に高いです。次のように:
ただし、Whisk は各ソース画像からいくつかの重要な要素しか抽出しないため、Google は、結果として得られる画像結果が期待と異なる可能性があることをユーザーに警告しています。たとえば、結果として得られる画像は、身長、体重、髪型、肌の色などが元の画像とは異なる場合があります。
Googleによれば、これらの詳細はプロジェクトの成功にとって重要であることが多いため、ユーザーは画像生成プロセスを推進するテキストプロンプトを表示および編集できるようになるという。
一部のアーティストやクリエイティブ専門家を含む初期のテスターは、Whisk は従来の画像エディターというよりも新しいクリエイティブ ツールのように感じられると述べています。 Googleは、このツールがユーザーが正確な編集ではなく視覚的なブレインストーミングを迅速に行うのに役立ち、ユーザーがお気に入りの作品を保存する前に複数のオプションを迅速に生成してフィルタリングできるようにしたいと考えています。
予備テストの結果、Whisk は非常に快適に使用できますが、新しい画像が生成されるたびに数秒待つ必要があります。こうした遅延は、ユーザーが新しいツールを試してみようと殺到するため、トラフィックが集中したことが原因である可能性があります。
現在、Whisk は米国のユーザーのみが利用でき、ユーザーは無料で試して labs.google/whisk でフィードバックを共有できます。その他の国のユーザーについては、一時的にこのツールにアクセスできなくなります。
Whisk は、Gemini、Imagen、最新のビデオ モデル Veo2 など、Google の AI プロジェクトをテストするための実験場である Google Labs の一部です。ほとんどのプロジェクトはまだ実験段階にありますが、最近正式にリリースされた AI アシスタント NotebookLM など、いくつかの成功したプロジェクトは完全な製品に変換される予定です。
製品体験アドレス:https://top.aibase.com/tool/whisk
ハイライト:
Google が初の画像主導型生成 AI ツール Whisk を発表。
ユーザーは、正確な編集ではなく、迅速なビジュアルデザインのために画像をアップロードまたは生成できます。
このトライアルは現在米国内のユーザーに限定されており、他の国からは一時的にアクセスできません。
全体として、Whisk は、Google Labs によって発表された新しい AI 画像生成ツールとして、ユーザーにアートを作成するためのより直観的かつ迅速な方法を提供しますが、まだテスト段階にありますが、その可能性は非常に大きく、将来の開発に価値があります。楽しみにしています。 今後、Whisk が世界中のユーザーに拡大し、その機能とパフォーマンスがさらに最適化されることを期待しています。