أعلنت Google مؤخرًا أن أحدث نموذج لتوليد الصور ، Imagen3 ، تم افتتاحه الآن للمطورين من خلال واجهة برمجة تطبيقات Gemini. لا يحتوي هذا النموذج على إمكانيات قوية لتوليد الصور فحسب ، بل يقوم أيضًا بإنشاء صور في مجموعة متنوعة من الأساليب الفنية بناءً على إشارات نص الإدخال ، والتي تغطي مجموعة واسعة من المناطق التي تتراوح من سريالية إلى شخصيات أنيمي.
Imagen3 بسيط للغاية للاستخدام. تبلغ تكلفة التوليد لكل صورة 0.03 دولار فقط ، وهي مناسبة للمطورين والشركات التي تتطلب توليد صور الدُفعات. من خلال استراتيجية التسعير المعقولة هذه ، تهدف Google إلى خفض العتبة للعمل الإبداعي والسماح لمزيد من الناس بالاستمتاع بمتعة الإنشاء الفني الذي جلبته الذكاء الاصطناعي.
يوضح Imagen3 قدرات رائعة عند إنشاء الصور. سواء كانت ألوانًا حساسة أو تفاصيل معقدة ، يمكن للنموذج أن يدرك بدقة أفكار المستخدم. لتحسين تجربة المستخدم ، قدم Imagen3 أيضًا وظيفة تتبع موجه محسّنة. على سبيل المثال ، وصف مظهر وخلفية حيوان ما ، يمكن للنموذج إنشاء صور مناسبة للغاية لتلبية الاحتياجات الإبداعية للمستخدمين.
بالإضافة إلى ذلك ، يأخذ Imagen3 أيضًا في الاعتبار حقوق الطبع والنشر وإساءة استخدام توليد الصور. ستأتي كل صورة تم إنشاؤها مع علامة مائية رقمية غير مرئية تسمى Synthid. لا يمكن التعرف على هذه العلامة المائية من خلال العين المجردة ، ولكن يمكن التحقق منها من خلال التكنولوجيا المتخصصة لضمان توليد الصور بواسطة الذكاء الاصطناعى ، مما يؤدي إلى الحد من مخاطر المعلومات الخاطئة والاستخدام غير السليم.
من السهل جدًا أيضًا للمطورين البدء في استخدام Imagen3. مع مثال رمز Python بسيط ، يمكن للمستخدمين التفاعل بسرعة مع API وإنشاء صورهم المفضلة. نظرًا لأن Google تخطط لتوصيل المزيد من النماذج التوليدية بآبار واجهة برمجة تطبيقات Gemini في المستقبل ، سيتمكن المطورون من إنشاء المزيد من المحتوى التفاعلي لدفع تنويع المنتجات الإبداعية.
تستكشف Google بنشاط مزيج من الوسائط التوليدية ونماذج اللغة ، وستكون سيناريوهات التطبيق في المستقبل أكثر شمولاً ، ويمكن للمطورين استخدام هذه التقنيات لتحقيق إمكانات أكبر في إنشاء المحتوى وتطوير الأدوات.
الوثائق: https://ai.google.dev/gemini- api/docs/imagen-prompt-guide؟hl=zh-cn
ستعمل خطوة Google على تعزيز تطبيق وتطوير تقنية الذكاء الاصطناعى ، بحيث يمكن لمزيد من المطورين والمؤسسات الاستمتاع بالراحة والابتكار التي جلبتها الذكاء الاصطناعي.