علم محرر Downcodes أن باحثين من Nvidia وجامعة تل أبيب طوروا بشكل مشترك أداة لإنشاء صور تعمل بالذكاء الاصطناعي تسمى ComfyGen، ويمكنها إنشاء مسارات عمل معقدة تلقائيًا بناءً على مطالبات نصية بسيطة، مما يبسط إلى حد كبير صعوبة إنشاء صور عالية الجودة. يخترق ComfyGen قيود الطريقة التقليدية لتحويل النص إلى صورة ذات النموذج الواحد من خلال اختيار النماذج بذكاء، وضبط الكلمات السريعة بدقة، والدمج مع الأدوات الأخرى، ويحقق ComfyGen تأثيرات أفضل لتوليد الصور، مما يؤدي إلى تغييرات ثورية في مجال صور الذكاء الاصطناعي. جيل. وتتمثل ميزتها الأساسية في أنها تحاكي أسلوب عمل المهندسين الفوريين ذوي الخبرة ويمكنها تعديل الاستراتيجيات بمرونة وفقًا للاحتياجات المختلفة، مما سيؤدي إلى خفض عتبة توليد الصور بشكل كبير وتحسين كفاءة المستخدمين المحترفين.
مؤخرًا، أطلق باحثون من Nvidia وجامعة تل أبيب أداة مبتكرة للذكاء الاصطناعي تسمى ComfyGen، مما أدى إلى تحقيق اختراقات جديدة في مجال توليد الصور. يمكن لـ ComfyGen إنشاء سير عمل صور معقد تلقائيًا استنادًا إلى مطالبات نصية بسيطة، مما يبسط عملية إنشاء صور عالية الجودة إلى حد كبير.
تكمن القوة الأساسية لشركة ComfyGen في نهج سير العمل متعدد الخطوات. على عكس الأساليب التقليدية لتحويل النص إلى صورة ذات النموذج الواحد، يختار ComfyGen بذكاء النموذج المناسب، ويصوغ مطالبات دقيقة، ويجمعه مع أدوات أخرى (مثل مكبرات الصور) لتحقيق أفضل النتائج. يحاكي هذا النهج الطريقة التي يعمل بها المهندسون الفوريون ذوو الخبرة، مع القدرة على ضبط استراتيجية الإنشاء بمرونة بناءً على محتوى النص المختلف وأنماط الصور المرغوبة.
تستخدم الأداة نماذج لغة متقدمة (مثل Claude3.5Sonnet) لفهم المطالبات النصية للمستخدمين وإنشاء مسارات العمل المقابلة تلقائيًا. استخدم الباحثون طريقتين لتحقيق هذه الوظيفة:
التعلم السياقي: الاستفادة من نماذج اللغة الموجودة لمساعدة النموذج على اختيار سير العمل الأكثر ملاءمة للمطالبات الجديدة من خلال توفير جدول سير عمل لفئات المطالبات المختلفة ومتوسط درجاتها.
الضبط الدقيق: يتم تدريب نماذج اللغة (مثل Llama-3.1-8B و-70B) خصيصًا للتنبؤ بسير العمل المناسب في ضوء النتيجة السريعة والمستهدفة.
في المقارنات مع النماذج الفردية التقليدية (مثل Stable Diffusion XL) وسير العمل الثابت، كان أداء ComfyGen جيدًا في كل من التسجيل الآلي ودراسات المستخدم. تظهر الأبحاث أن سير العمل الذي تم إنشاؤه بواسطة ComfyGen يمكن أن يتطابق بشكل جيد مع فئة الموجهات، مثل نماذج تكبير الوجه من المرجح أن يتم استخدامها عند معالجة المطالبات البشرية، بينما يتم استخدام النماذج الصحيحة تشريحيًا بشكل أكبر عند معالجة مطالبات الرسوم المتحركة.
ميزة أخرى لـ ComfyGen هي قدرتها على التكيف. إنه يعتمد على سير العمل الحالي ونماذج التسجيل التي أنشأها المجتمع ويمكنه التكيف بسرعة مع التطورات التكنولوجية الجديدة. ومع ذلك، فإن هذا يؤدي أيضًا إلى بعض القيود، أي أن النظام الحالي يعتمد بشكل أساسي على بيانات التدريب المعروفة للاختيار، مما قد يحد من تنوع وأصالة سير العمل الناتج.
للمضي قدمًا، يخطط فريق البحث لمواصلة تطوير ComfyGen لتمكين إنشاء مسارات عمل جديدة تمامًا وتوسيع نطاق تطبيقه ليشمل مهام صورة إلى صورة. واقترحوا أيضًا فكرة الجمع بين هذا النهج والنهج القائم على الوكيل لتحسين سير العمل بشكل متكرر من خلال حوار المستخدم، والذي قد يصبح اتجاهًا جديدًا للبحث المستقبلي.
يوفر ظهور ComfyGen إمكانيات جديدة في مجال إنشاء صور الذكاء الاصطناعي:
يقلل من حاجز الدخول: من خلال أتمتة عمليات سير العمل المعقدة، يمكن لـ ComfyGen مساعدة المبتدئين في إنشاء صور عالية الجودة بسهولة أكبر.
تحسين الكفاءة: بالنسبة للمستخدمين المحترفين، يمكن لـ ComfyGen تقليل وقت ضبط سير العمل يدويًا وتحسين كفاءة العمل بشكل كبير.
مخرجات مخصصة: من خلال الاختيار الذكي للنماذج والمعلمات، تستطيع ComfyGen إنشاء صور أكثر تخصيصًا بناءً على الاحتياجات المختلفة.
تعزيز الابتكار التكنولوجي: قد يلهم نهج ComfyGen المزيد من الابتكار في مجال توليد صور الذكاء الاصطناعي ويعزز تطوير أدوات أكثر ذكاءً ومرونة.
التطبيق عبر المجالات: يمكن تطبيق المفهوم الناتج عن سير العمل الذكي هذا على مجالات أخرى، مثل معالجة الصوت وتحرير الفيديو وما إلى ذلك.
على الرغم من أن الكود والعروض التوضيحية الخاصة بـ ComfyGen لم يتم نشرها علنًا بعد، إلا أن إمكاناتها قد جذبت اهتمامًا واسع النطاق في الصناعة. ومع تطور هذه التكنولوجيا وتحسنها، يمكننا أن نتوقع رؤية ظهور المزيد من أدوات الإبداع الذكي القائمة على الذكاء الاصطناعي، مما يجلب تغييرات وفرصًا جديدة للصناعة الإبداعية.
وبشكل عام، يمثل ظهور ComfyGen خطوة كبيرة إلى الأمام في تكنولوجيا توليد الصور بالذكاء الاصطناعي، وسوف تؤثر أتمتتها وكفاءتها وتخصيصها بشكل عميق على طريقة إنشاء الصور في المستقبل. نحن نتطلع إلى الإصدار الرسمي لـ ComfyGen ونشهد التغييرات التي يجلبها إلى الصناعة الإبداعية.