أصدر فريق البحث في Google Alchemist، وهي تقنية متقدمة لتحرير الصور تتيح للمستخدمين التحكم بدقة في خصائص المواد الموجودة في الصور، مثل اللون واللمعان والشفافية، دون الحاجة إلى برامج أو مهارات احترافية. يعد Alchemist في جوهره نموذجًا دقيقًا لإنشاء تحويل النص إلى صورة يحقق تحكمًا دقيقًا في معلمات المواد من خلال تجميع مجموعات البيانات وتعديل بنية نموذج Stable Diffusion 1.5. تتمتع هذه التقنية بالقدرة على إحداث ثورة في عملية تحرير الصور، وتوفير أدوات قوية للمحترفين مثل المصممين والفنانين والمهندسين المعماريين.
أطلق فريق بحث Google مؤخرًا تقنية متقدمة - Alchemist. تتيح هذه التقنية للمستخدمين إمكانية تحرير الخصائص المادية للعناصر الموجودة في الصورة بدقة، مثل اللون واللمعان والشفافية، دون الحاجة إلى برامج ومهارات احترافية لتحرير الصور.
يكمن جوهر تقنية Alchemist في نموذج إنشاء تحويل النص إلى صورة (T2I) المضبوط بدقة. حقق فريق البحث تحكمًا دقيقًا في معلمات المواد من خلال إنشاء مجموعات بيانات تركيبية وتعديل بنية نموذج Stable Diffusion1.5.
على وجه التحديد، قام الباحثون أولاً بإنشاء عدد كبير من الصور الاصطناعية باستخدام رسومات الكمبيوتر وتقنيات العرض المادية. تحتوي هذه الصور على نماذج ثلاثية الأبعاد متنوعة بمواد مختارة عشوائيًا وزوايا الكاميرا وظروف الإضاءة. ثم قاموا بإجراء تغييرات على السمات الفردية لهذه الصور، مما أدى إلى إنشاء إصدارات متعددة ذات قوة تحرير متفاوتة.
من خلال الضبط الدقيق لهذه البيانات الاصطناعية، يتعلم النموذج كيفية تغيير خصائص المواد المحددة فقط، مع إعطاء صور السياق والتعليمات وقيم الكثافة التحريرية، مع الحفاظ على شكل العنصر وإضاءة الصورة دون تغيير.
تظهر النتائج التجريبية أن هذه التقنية يمكنها تغيير مظهر الأشياء بشكل فعال، مثل تعزيز الملمس المعدني أو ضبط الشفافية. في دراسات المستخدم، حقق هذا النهج مزايا كبيرة في كل من الواقعية وتفضيل المستخدم مقارنة بالنهج الأساسي.
آفاق تطبيق هذه التكنولوجيا واسعة. يمكن أن يساعد مصممي الديكور الداخلي على معاينة الشكل الذي ستبدو عليه الغرفة عند إعادة طلاءها، أو مساعدة المهندسين المعماريين والفنانين والمصممين في إنشاء رسومات تخطيطية للمنتجات الجديدة بسرعة. بالإضافة إلى ذلك، نظرًا لأن تأثيرات التحرير متسقة بصريًا، يمكن أيضًا استخدام التقنية في المهام ثلاثية الأبعاد النهائية مثل إعادة بناء NeRF (مجال الإشعاع العصبي).
على الرغم من أن تقنية الخيميائي حققت تقدمًا كبيرًا في تحرير المواد، إلا أن فريق البحث أشار أيضًا إلى بعض القيود. على سبيل المثال، لا يزال لدى النموذج مجال للتحسين عندما يتعلق الأمر بالتعامل مع التفاصيل المخفية في الصور.
ومع ذلك، فإن الباحثين واثقون من إمكانات التكنولوجيا في تحرير المواد الخاضعة للرقابة. ومن خلال المزيد من البحث والتحسين، من المتوقع أن يُحدث Alchemist ثورة في مجال تحرير الصور، مما يجعل مهام تحرير المواد المعقدة أبسط وأكثر سهولة.
تمثل تقنية Alchemist من Google إنجازًا كبيرًا آخر في الذكاء الاصطناعي في مجال معالجة الصور. فهو لا يبسط عملية تحرير الصور المعقدة فحسب، بل يوفر أيضًا إمكانيات جديدة للصناعة الإبداعية ومن المتوقع أن يكون له تأثير عميق في مجالات متعددة مثل التصميم والفن والواقع الافتراضي.
عنوان المشروع: https://prafullsharma.net/alchemist/
يمثل ظهور تقنية Alchemist علامة فارقة أخرى في مجال الذكاء الاصطناعي في تحرير الصور. من المؤكد أن قدراتها الفعالة والدقيقة في تحرير المواد ستجلب حيوية جديدة للصناعة الإبداعية وتعزز التطوير المستمر والابتكار في التقنيات ذات الصلة.