أصدرت Google Cloud أحدث نماذجها لتوليد الفيديو والصور Veo وImagen 3، ودمجها في منصة Vertex AI. يمكن لـ Veo إنشاء ما يصل إلى 60 ثانية من الفيديو عالي الوضوح بناءً على مطالبات نصية أو صورية، بينما يركز Imagen 3 على إنشاء صور واقعية ويوفر إمكانات تحرير الصور. ويهدف إطلاق هذين النموذجين إلى توفير أدوات إبداعية أكثر قوة للتسويق والإعلان وغيرها من المجالات، وتحسين الكفاءة الإبداعية وتسريع إنتاج المحتوى. وتأتي خطوة جوجل في أعقاب إطلاق منتجات مماثلة من قبل المنافسين، وتمثل أيضًا اشتداد منافسة الذكاء الاصطناعي في مجال إنشاء المحتوى المرئي.
أعلنت Google Cloud مؤخرًا أن أحدث نماذجها لتوليد الفيديو والصور، Veo وImagen3، متاحة الآن على منصة Vertex AI، مما يزيد من تعزيز تطبيق الذكاء الاصطناعي في التسويق والإعلان.
نموذج Veo، الذي تم الكشف عنه لأول مرة في مؤتمر Google I/O للمطورين، هو استجابة Google DeepMind للمنتجات المنافسة مثل Runway's Gen-3 وOpenAI's Sora. يقوم النموذج بتحويل النص أو إشارات الصورة إلى ما يصل إلى 60 ثانية من الفيديو عالي الوضوح بنمط سينمائي مع تناسق ممتاز على مستوى الإطار لضمان حركة سلسة للهدف داخل اللقطة.
يركز Imagen3 على توليد الصور، وهو قادر على إنشاء تأثيرات بصرية واقعية تعتمد على النص، ويتفوق على سابقاته في التفاصيل والإضاءة وتقليل القطع الأثرية. بالإضافة إلى ذلك، يقدم Imagen3 أيضًا وظائف التحرير، مما يسمح للمستخدمين بتحسين الصور التي تم إنشاؤها من خلال المطالبات النصية، بما في ذلك ترقية الصورة والإصلاح والطلاء الخارجي واستبدال الخلفية، لتلبية الاحتياجات الإبداعية الشخصية.
ومن خلال دمج Veo وImagen3، يوفر Google Cloud أدوات إبداعية أكثر قوة للفرق في مجال التسويق والمبيعات والمجالات الأخرى. يعمل تطبيق Imagen3 على تبسيط إنتاج صور المنتجات عالية الجودة ومحتوى الوسائط الاجتماعية، بينما يقوم Veo بتحويل هذه العناصر المرئية إلى مقاطع فيديو جميلة، مما يساعد الفرق على تكرار الأفكار بسرعة وتسريع إنتاج المحتوى.
وقال وارن باركلي، المدير الأول لإدارة المنتجات في جوجل، إن العملاء مثل أجودا يستخدمون نماذج الذكاء الاصطناعي مثل Veo وImagen لتقصير دورة إنتاج إعلانات الفيديو بشكل كبير وتحسين الكفاءة الإبداعية. بالإضافة إلى ذلك، تتمتع Veo وImagen3 بميزات أمان مدمجة مثل العلامات المائية الرقمية والإشراف على المحتوى لمعالجة المخاطر التي يشكلها الذكاء الاصطناعي التوليدي.
تمثل هذه الابتكارات فرصة للشركات في جميع أنحاء العالم لإعادة تصور إنشاء المحتوى المرئي وتقديمه. من بين أوائل الشركات التي تبنّت هذه الفكرة شركة Mondelēz International (علامات تجارية مثل Oreo وCadbury وما إلى ذلك) وعملاق التسويق العالمي WPP. مع استمرار نموذج جوجل الأساسي في التوسع، ستتمكن الشركات في مختلف الصناعات من استخدام الذكاء الاصطناعي لدفع التغيير الإبداعي بكفاءة أكبر.
إن انتقال Google إلى إنتاج الفيديو يعني أن المنافسة أصبحت أكثر شراسة. تكرارًا لـ Nova Reel التي أصدرتها Amazon AWS في مؤتمر re:Invent، وضعت Google’s Veo وNova Reel معايير جديدة في مجال إنشاء فيديو الذكاء الاصطناعي. تقوم Nova Reel بإنشاء مقاطع فيديو عالية الجودة مدتها ست ثوانٍ استنادًا إلى إشارات النص والصور، وهي متاحة أيضًا من خلال منصة Amazon Bedrock.
ولم تطلق مايكروسوفت بعد نموذجًا لإنشاء الفيديو، على الرغم من أن منصة AI Foundry الخاصة بها توفر أدوات لإنشاء الصور. تتوقع الصناعة أنه مع إصدار نموذج إنشاء الفيديو Sora من OpenAI، ستلحق Microsoft بركب هذا المجال.
العنوان: https://cloud.google.com/blog/products/ai-machine-learning/introducing-veo-and-imagen-3-on-vertex-ai
يمثل إطلاق Veo وImagen 3 خطوة مهمة للذكاء الاصطناعي في مجال إنشاء المحتوى المرئي، وفي المستقبل، ستستفيد المزيد من الشركات من هذه التكنولوجيا وتعزز التطوير الإضافي للصناعة الإبداعية. مما لا شك فيه أن استثمار Google المستمر في مجال الذكاء الاصطناعي سيزيد من تعميق مكانتها في سوق الحوسبة السحابية.