Para peneliti di ETH Zurich telah membuat terobosan di bidang estimasi kedalaman monokuler. Mereka dengan cerdik memanfaatkan model Marigold sumber terbuka Difusi Stabil dan mencapai estimasi kedalaman berkinerja tinggi tanpa memerlukan data pelatihan gambar kedalaman nyata dengan menyempurnakan modul denoising U-Net. Inovasi dari penelitian ini adalah menggunakan data sintetik untuk melatih model dan menggabungkannya dengan metode estimasi kedalaman affine invariant untuk secara efektif menyelesaikan masalah kesalahan yang disebabkan oleh ketidakpastian parameter internal kamera dan meningkatkan performa umum model dalam pemandangan yang tidak diketahui. kemampuan isasi.
Para peneliti di ETH Zurich mencapai inovasi dalam estimasi kedalaman monokuler dengan memodifikasi model Marigold sumber terbuka Difusi Stabil. Model ini mencapai performa luar biasa dengan menyempurnakan modul denoising U-Net tanpa memerlukan data pelatihan gambar kedalaman aktual. Dengan melatih data sintetis, Marigold dapat mempelajari berbagai skenario dan meningkatkan kemampuan generalisasi pada kumpulan data yang tidak terlihat. Ide teknis intinya adalah menggunakan pengetahuan sebelumnya tentang Difusi Stabil dan mengadopsi metode estimasi kedalaman invarian affine untuk menghilangkan kesalahan estimasi kedalaman yang disebabkan oleh ketidakpastian parameter internal kamera.
Hasil penelitian ini memberikan ide baru untuk teknologi estimasi kedalaman monokuler. Efisiensi tinggi dan kemampuan generalisasinya diharapkan dapat digunakan secara luas di bidang-bidang seperti mengemudi otonom dan navigasi robot. Penelitian ini sepenuhnya menunjukkan potensi model Difusi Stabil dan nilai penerapannya dalam memecahkan masalah praktis.