أطلقت جوجل أداة جديدة لتوليد الصور تعمل بالذكاء الاصطناعي تسمى Whisk، والتي تغير الطريقة التقليدية لتوليد الصور تمامًا. على عكس الحاجة السابقة إلى أوصاف نصية مطولة، يتيح Whisk للمستخدمين تحميل الصور مباشرة ككلمات سريعة لتحديد موضوع الصور التي تم إنشاؤها ومشهدها ونمطها. يمكن للمستخدمين توفير صور متعددة لكل جانب من هذه الجوانب الثلاثة، وسوف يقوم Whisk بدمج هذه المعلومات المرئية بذكاء لإنشاء صور غير متوقعة. حتى في حالة عدم وجود صورة مناسبة، يوفر Whisk أيضًا وظيفة إنشاء صور عشوائية لمساعدة المستخدمين على بدء الإنشاء بسرعة.
أصدرت Google أداة جديدة للذكاء الاصطناعي تسمى Whisk، والتي تعمل على تخريب نموذج إنشاء الصور التقليدي وتسمح للمستخدمين باستخدام الصور ككلمات سريعة بدلاً من الأوصاف النصية الطويلة.
باستخدام Whisk، يمكنك تحميل الصور لتحديد الموضوع والمشهد ونمط الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي، ويمكنك استخدام صور متعددة لكل صورة من الصور الثلاثة.
على سبيل المثال، قمت بإدخال صورة خنزير وصورة قطة، وحددت نمط الرسم التوضيحي، ثم لم أدخل أي كلمات مطالبة (بالطبع، يمكنك أيضًا اختيار استخدام المطالبات النصية في نفس الوقت.) لقد أعطاني تلقائيًا مثل هذا العرض. لاحظ أن SCENE يُدخل صور المشهد بشكل عام، بالطبع، لا توجد مشكلة إذا كان عليك إدخال صور الشخصيات مثلي، فسيتم دمجها تلقائيًا وإنشاؤها. في بعض الأحيان قد لا تكون ذات صلة جدًا، ولكن ستكون هناك مفاجآت غير متوقعة.
إذا لم تكن لديك صورة مناسبة في متناول اليد، فيمكنك النقر على أيقونة النرد لجعل Google يملأ بعض الصور تلقائيًا كمطالبات (يبدو أن هذه الصور أيضًا تم إنشاؤها بواسطة الذكاء الاصطناعي).
قمت بالنقر بشكل عرضي، وقدم Google بشكل عشوائي صورًا لكلب وقارب وتطريز لمعرفة نوع التأثير الذي سينتجه الخليط:
التأثير جيد جدًا، تم مزج عناصر الصور الثلاث معًا بشكل مثالي لتكوين صورة تطريز مثيرة للاهتمام ~
بالنقر على الصورة، اكتشفت أن Whisk يوفر أيضًا تلميحات نصية لكل صورة تم إنشاؤها. إذا كنت راضيًا عن النتيجة، يمكنك حفظ الصورة أو تنزيلها؛ وإذا كنت تريد تحسينها بشكل أكبر، فيمكنك إضافة المزيد من النص في مربع النص، أو النقر على الصورة مباشرة لتحرير المطالبة النصية.
وأكدت جوجل في منشور على مدونتها أن Whisk مصمم من أجل "الاستكشاف البصري السريع، وليس التحرير الدقيق للبكسل". وتقول الشركة أيضًا إن Whisk يمكن أن "يخرج عن المسار الصحيح"، لذا فهو يسمح للمستخدمين بتحرير الكلمات المطالبة الأساسية.
لقد استخدمت أداة Whisk لبضع دقائق ووجدتها مثيرة للاهتمام للغاية. على الرغم من أن إنشاء الصور يستغرق بضع ثوانٍ مزعجة بعض الشيء، وقد تبدو الصور الناتجة غريبة بعض الشيء في بعض الأحيان، إلا أن العملية التكرارية ممتعة.
وقالت جوجل إن Whisk يستخدم أحدث إصدار من نموذج توليد الصور Imagen3، والذي تم إصداره رسميًا أيضًا اليوم. أصدرت Google أيضًا جيلًا جديدًا من نموذج توليد الفيديو Veo2، والذي يقال إنه قادر على فهم "اللغة الفريدة للأفلام" ويحتوي على عدد "أقل" من القطع الأثرية مثل الأصابع الإضافية. سيتم إطلاق Veo2 أولاً في VideoFX من Google، ويمكن للمستخدمين التقدم لتجربته من خلال قائمة انتظار Google Labs، مع خطط للتوسع ليشمل YouTube Shorts ومنتجات أخرى في العام المقبل.
بشكل عام، جلب ظهور Whisk إمكانيات جديدة لتوليد الصور، مما يسمح للمستخدمين بالتعبير عن إبداعاتهم من خلال الوسائل المرئية وتحقيق التخصيص الشخصي للصور بسهولة أكبر.
عنوان تجربة المنتج: https://top.aibase.com/tool/whisk
بفضل أسلوبه المبتكر في توليد الصور، يوفر Whisk للمستخدمين تجربة أكثر سهولة وملاءمة في إنشاء الصور، الأمر الذي يستحق التجربة. أسرع وقم بزيارة الرابط لتجربة أداة الذكاء الاصطناعي القوية هذه!