أطلقت Google Labs مؤخرًا Whisk، وهي أداة لإنشاء الأعمال الفنية تعتمد على الذكاء الاصطناعي، مما يوفر تجربة جديدة في الإبداع الفني. على عكس أدوات إنشاء الصور التقليدية التي تحتوي على مطالبات نصية، يتيح Whisk للمستخدمين تحميل أو إنشاء صور مباشرة داخل الأداة وتحديد السمات والمشاهد والأنماط لتحقيق إبداع فني أكثر سهولة. يمكن للمستخدمين مزج المكونات المختلفة ومطابقتها وضبطها باستخدام المطالبات النصية لإنتاج أعمال فنية فريدة ومبتكرة. التكنولوجيا وراء Whisk عبارة عن مزيج من نموذج اللغة القوي من Google ونموذج إنشاء الصور، والذي يمكنه التقاط الخصائص الأساسية للصورة بدلاً من مجرد نسخها.
أطلقت Google Labs مؤخرًا Whisk، أحدث أدواتها لتجربة الذكاء الاصطناعي في الولايات المتحدة. على عكس أدوات إنشاء الصور التقليدية التي تعتمد بشكل أساسي على المطالبات النصية، يركز Whisk على استخدام الصور كطريقة إدخال، مما يسمح للمستخدمين بإنشاء أعمال فنية بشكل أكثر سهولة.
يمكن للمستخدمين تحميل الصور مباشرة إلى Whisk، أو إنشاء صور داخل الأداة، مع تحديد عناصر مثل السمة والمشهد والأسلوب. يتيح نظام Whisk للمستخدمين مزج هذه المكونات ومطابقتها وضبطها حسب الحاجة باستخدام مطالبات نصية إضافية.
تجدر الإشارة إلى أنه خلف الكواليس، يقوم نموذج لغة Google (ربما إصدار Gemini 2.0 Flash الذي تم إصداره مؤخرًا) تلقائيًا بإنشاء وصف تفصيلي لصورة الإدخال. سيتم إدخال هذه الأوصاف في أحدث نموذج لتوليد الصور من Google، وهو Imagen3، الذي يلتقط الخصائص الأساسية للموضوع بدلاً من إنشاء نسخة طبق الأصل.
أجرت AIbase العديد من الاختبارات بعد تحميل الصور الثلاث على اليسار، ويمكن دمجها لإنشاء النتيجة على اليمين. على النحو التالي:
ومع ذلك، نظرًا لأن Whisk يستخرج فقط بعض العناصر الأساسية من كل صورة مصدر، فإن Google تحذر المستخدمين من أن نتائج الصور الناتجة قد تختلف عن التوقعات. على سبيل المثال، قد تختلف الصورة الناتجة عن الصورة الأصلية في الطول أو الوزن أو تصفيفة الشعر أو لون البشرة.
تقول جوجل إن هذه التفاصيل غالبًا ما تكون حاسمة لنجاح المشروع، لذا فهي تسمح للمستخدمين بمشاهدة وتحرير المطالبات النصية التي تقود عملية إنشاء الصور.
يقول المختبرون الأوائل، بما في ذلك بعض الفنانين والمهنيين المبدعين، إن Whisk يبدو وكأنه أداة إبداعية جديدة أكثر من كونه محرر صور تقليدي. وتأمل جوجل أن تساعد الأداة المستخدمين على القيام بالعصف الذهني البصري بسرعة بدلاً من التحرير الدقيق، مما يسمح للمستخدمين بإنشاء خيارات متعددة وتصفيتها بسرعة قبل حفظ الأعمال المفضلة.
بعد الاختبار الأولي، على الرغم من أن Whisk ممتع جدًا للاستخدام، إلا أنه يتطلب بضع ثوانٍ من الانتظار حتى يتم إنشاء كل صورة جديدة. من المحتمل أن تكون هذه التأخيرات بسبب ارتفاع عدد الزيارات، حيث يتدفق المستخدمون لتجربة الأداة الجديدة.
حاليًا، يتوفر Whisk فقط للمستخدمين في الولايات المتحدة، ويمكن للمستخدمين تجربته مجانًا ومشاركة تعليقاتهم على labs.google/whisk. أما بالنسبة للمستخدمين في البلدان الأخرى، فلن يتمكنوا مؤقتًا من الوصول إلى هذه الأداة.
يعد Whisk جزءًا من Google Labs، وهو بمثابة أرض اختبار Google لاختبار مشاريع الذكاء الاصطناعي الخاصة بها، بما في ذلك Gemini وImagen وأحدث نموذج فيديو Veo2. في حين أن معظم المشاريع لا تزال في المرحلة التجريبية، فإن بعض المشاريع الناجحة، مثل مساعد الذكاء الاصطناعي NotebookLM الذي تم إصداره رسميًا مؤخرًا، سيتم تحويلها إلى منتجات كاملة.
عنوان تجربة المنتج: https://top.aibase.com/tool/whisk
تسليط الضوء على:
أطلقت Google Whisk، أول أداة ذكاء اصطناعي توليدية تعتمد على الصور.
يمكن للمستخدمين تحميل أو إنشاء صور لتصميم مرئي سريع بدلاً من التحرير الدقيق.
يقتصر الإصدار التجريبي حاليًا على المستخدمين في الولايات المتحدة ولا يمكن الوصول إليه مؤقتًا في البلدان الأخرى.
بشكل عام، توفر Whisk، باعتبارها أداة جديدة لتوليد الصور تعمل بالذكاء الاصطناعي والتي أطلقتها Google Labs، للمستخدمين طريقة أكثر سهولة وأسرع لإنشاء أعمال فنية. وعلى الرغم من أنها لا تزال في مرحلة الاختبار، إلا أن إمكاناتها هائلة ويستحق تطويرها في المستقبل نتطلع إلى. نحن نتطلع إلى توسيع نطاق Whisk ليشمل المستخدمين العالميين في المستقبل وتحسين وظائفه وأدائه بشكل أكبر.