قامت بيكا وجامعة بكين وستانفورد بإصدار إطار عمل جديد لنموذج الانتشار مفتوح المصدر يسمى RPG، والذي يستخدم بذكاء تقنية نموذج اللغة الكبيرة (LLM) لتعزيز قدرة نموذج الانتشار على فهم ومعالجة الكلمات السريعة المعقدة. تتيح هذه التقنية المتطورة للصور التي تم إنشاؤها أن تتطابق بشكل أكثر دقة مع متطلبات الكلمات السريعة التي يقدمها المستخدم، ويتجاوز تأثيرها تأثير Dall·E 3 الحائز على جوائز. أثار هذا الخبر مناقشات ساخنة على الإنترنت بمجرد نشره، وجاء الباحثون المشاركون في المشروع من جامعة بكين، وجامعة ستانفورد، والفريق المؤسس المشارك لشركة بيكا. توفر هذه التكنولوجيا إمكانيات جديدة في مجال توليد صور الذكاء الاصطناعي، فلننتظر ونرى تطورها المستقبلي.
تعاونت Pika مع جامعة بكين وستانفورد لفتح إطار عمل RPG، باستخدام تقنية LLM لتحسين قدرة نموذج الانتشار على فهم الكلمات السريعة المعقدة، وتجاوز التأثير Dall·E 3. يمكن لإطار العمل إنشاء صور تلبي متطلبات الكلمات السريعة بشكل أفضل وقد تسبب في مناقشات ساخنة عبر الإنترنت. المؤلفون المشاركون هم من جامعة بكين وستانفورد والمؤسس المشارك لبيكا. يرجى زيارة الرابط الأصلي للحصول على التفاصيل.
يمثل المصدر المفتوح لإطار عمل RPG خطوة كبيرة إلى الأمام في تكنولوجيا توليد صور الذكاء الاصطناعي، مما يوفر للمطورين والباحثين أدوات جديدة قوية. في المستقبل، يمكننا أن نتطلع إلى المزيد من التطبيقات المبتكرة القائمة على تقنية LLM، مما يوفر لنا تجربة أكثر روعة في توليد الصور باستخدام الذكاء الاصطناعي.