حقق الباحثون في ETH Zurich طفرة في مجال تقدير العمق أحادي العين. لقد استفادوا بذكاء من نموذج Marigold مفتوح المصدر من Stable Diffusion وحققوا تقديرًا عالي الأداء للعمق دون الحاجة إلى بيانات تدريب صور عميقة حقيقية من خلال الضبط الدقيق لوحدة U-Net الخاصة بها التي تقلل الضوضاء. الابتكار في هذا البحث هو أنه يستخدم البيانات الاصطناعية لتدريب النموذج ودمجها مع طريقة تقدير العمق الثابت لحل مشكلة الخطأ الناتجة عن عدم اليقين في المعلمات الداخلية للكاميرا بشكل فعال وتحسين الأداء العام للنموذج في المشاهد غير المعروفة. القدرة على التخصيص.
حقق الباحثون في ETH Zurich ابتكارًا في تقدير العمق أحادي العين من خلال تعديل نموذج Marigold مفتوح المصدر للانتشار المستقر. يحقق هذا النموذج أداءً ممتازًا من خلال الضبط الدقيق لوحدة U-Net لتقليل الضوضاء دون الحاجة إلى بيانات تدريب فعلية لصورة العمق. ومن خلال التدريب على البيانات الاصطناعية، تستطيع Marigold تعلم مجموعة واسعة من السيناريوهات وتحسين قدرات التعميم على مجموعات البيانات غير المرئية. تتمثل الفكرة التقنية الأساسية في استخدام المعرفة السابقة بـ Stable Diffusion واعتماد طريقة تقدير العمق الثابت للتخلص من خطأ تقدير العمق الناجم عن عدم اليقين بشأن المعلمات الداخلية للكاميرا.
توفر نتيجة البحث هذه فكرة جديدة لتقنية تقدير العمق أحادي العين، ومن المتوقع أن يتم استخدام كفاءتها العالية وقدرتها على التعميم على نطاق واسع في مجالات مثل القيادة الذاتية والملاحة الآلية، وهو أمر يستحق التطلع إليه. يوضح هذا البحث بشكل كامل إمكانات نموذج الانتشار المستقر وقيمة تطبيقه في حل المشكلات العملية.