طورت جامعة شنغهاي للتكنولوجيا نموذجًا متطورًا للذكاء الاصطناعي يسمى CLAY، والذي يمكنه إنشاء كائنات ثلاثية الأبعاد مفصلة بناءً على أوصاف نصية أو صور ثنائية الأبعاد. بفضل سرعة التوليد الفعالة والإنتاج عالي الجودة، أظهر CLAY إمكانات كبيرة في مجال النمذجة ثلاثية الأبعاد ومن المتوقع أن يحدث ثورة في صناعات مثل تطوير الألعاب وإنتاج الأفلام والطباعة ثلاثية الأبعاد. يكمن جوهر نموذج CLAY في جهاز التشفير التلقائي المتغير متعدد الدقة ومحول الانتشار، حيث يمكنه معالجة المحتوى ثلاثي الأبعاد مباشرةً دون التحويل إلى صور ثنائية الأبعاد، ويدعم المستخدمين للتحكم بدقة في النتائج التي تم إنشاؤها من خلال الأشكال المخصصة أو المربعات المحيطة، مما يُظهر مرونة قوية.
قام العلماء في جامعة ShanghaiTech مؤخرًا بتطوير نموذج ذكاء اصطناعي يسمى CLAY يمكنه إنشاء كائنات ثلاثية الأبعاد مفصلة من أوصاف نصية أو صور ثنائية الأبعاد. بالمقارنة مع التقنيات السابقة، حقق CLAY اختراقات كبيرة في جودة وتنوع الكائنات ثلاثية الأبعاد التي تم إنشاؤها.
يتضمن جوهر نموذج CLAY جهاز تشفير تلقائي متغير متعدد الدقة (VAE) ومحول نشر (DiT). VAE مسؤول عن تشفير الأشكال الهندسية ثلاثية الأبعاد بمستويات مختلفة من التفاصيل في الفضاء الكامن، بينما DiT مسؤول عن إنشاء هذه الأشكال الهندسية. على عكس العديد من الأنظمة الأخرى، فإن CLAY قادر على معالجة المحتوى ثلاثي الأبعاد مباشرة دون التحويل أولاً إلى صور ثنائية الأبعاد.
تتجاوز بيانات التدريب الخاصة بـ CLAY 500000 نموذج ثلاثي الأبعاد، تغطي مجموعة واسعة من الكائنات بدءًا من الأشياء اليومية البسيطة وحتى المخلوقات الخيالية المعقدة. بالإضافة إلى ذلك، يتمتع CLAY أيضًا بالقدرة على التحكم من خلال مدخلات إضافية. يمكن للمستخدمين تحقيق تحكم دقيق في النتائج التي تم إنشاؤها عن طريق تحديد الأشكال التقريبية (مثل هياكل فوكسل، أو السحب النقطية) أو المربعات المحيطة. تسمح هذه المرونة لـ CLAY بإنشاء مشاهد للمدينة بأكملها وحتى إعادة بناء نماذج ثلاثية الأبعاد مفصلة من الرسومات المرسومة يدويًا.
بالمقارنة مع الأنظمة الأخرى (مثل Shap-E، DreamFusion، Wonder3D)، يُظهر CLAY مزايا واضحة. سواء تم تحويل النص إلى ثلاثي الأبعاد أو الصورة إلى ثلاثي الأبعاد، يمكن لـ CLAY إنشاء أشكال هندسية أكثر اتساقًا وأسطح أكثر سلاسة وتفاصيل أدق. يتميز CLAY أيضًا بالسرعة المذهلة في إنشاء أصول ثلاثية الأبعاد عالية الجودة، حيث يستغرق حوالي 45 ثانية فقط، في حين أن بعض أنظمة المقارنة يمكن أن تستغرق ساعات لتحسينها.
لدى CLAY مجموعة واسعة من التطبيقات المحتملة، بما في ذلك تطوير الألعاب وإنتاج الأفلام والطباعة ثلاثية الأبعاد. ومع ذلك، يدرك الباحثون المخاطر المحتملة للمحتوى الافتراضي الناتج عن الذكاء الاصطناعي، لذا يخططون لإضافة المزيد من الإجراءات الأمنية لضمان الاستخدام المسؤول.
وفي المستقبل، يخطط الباحثون أيضًا لتوسيع بيانات التدريب، وتحسين جودة النموذج، ودمج توليد الهندسة وتوليف المواد في نموذج واحد لتحقيق وظائف أكثر شمولاً. يمكن الوصول إلى نسخة من CLAY من خلال خدمة 3D-Gen Rodin.
مدخل المنتج: https://hyperhuman.deemos.com/rodin
يمثل ظهور نموذج CLAY قفزة كبيرة في تكنولوجيا النمذجة ثلاثية الأبعاد، كما أن قدراته الإنتاجية عالية الجودة وآفاق التطبيق الواسعة تجعله أداة مهمة في مجال إنشاء المحتوى ثلاثي الأبعاد في المستقبل. في المستقبل، ومع التطوير والتحسين المستمر للتكنولوجيا، ستجلب CLAY بالتأكيد المزيد من الابتكارات والإمكانيات لجميع مناحي الحياة.