蘇黎世聯邦理工學院的研究人員在單目深度估計領域取得了突破性進展。他們巧妙地利用Stable Diffusion開源Marigold模型,透過微調其去雜訊U-Net模組,在無需真實深度影像訓練資料的情況下,實現了高效能的深度估計。這項研究的創新之處在於,它利用合成資料訓練模型,並結合仿射不變深度估計方法,有效地解決了相機內參不確定性所帶來的誤差問題,提升了模型在未知場景下的泛化能力。
蘇黎世聯邦理工學院的研究人員透過魔改Stable Diffusion開源Marigold模型,實現了單目深度估計的創新。該模型在不需要實際深度影像訓練資料的情況下,透過微調去噪U-Net模組取得了出色的性能。透過合成資料訓練,Marigold能夠學習到廣泛的場景,提高在未見過資料集上的泛化能力。核心技術思路是利用Stable Diffusion的先驗知識,採用仿射不變深度估計方法,消除相機內參不確定性所造成的深度估計誤差。
這項研究成果為單目深度估計技術提供了新的思路,其高效性和泛化能力預計將在自動駕駛、機器人導航等領域廣泛應用,未來發展值得期待。 研究充分展現了Stable Diffusion模型的潛力,以及在解決實際問題中的應用價值。