Des chercheurs de l'ETH Zurich ont réalisé une percée dans le domaine de l'estimation de la profondeur monoculaire. Ils ont intelligemment exploité le modèle open source Marigold à diffusion stable et obtenu une estimation de profondeur haute performance sans avoir besoin de données réelles de formation d'image de profondeur en affinant son module de débruitage U-Net. L'innovation de cette recherche réside dans le fait qu'elle utilise des données synthétiques pour entraîner le modèle et les combine avec la méthode d'estimation de profondeur affine et invariante pour résoudre efficacement le problème d'erreur causé par l'incertitude des paramètres internes de la caméra et améliorer les performances générales du modèle dans des scènes inconnues. capacité de isation.
Des chercheurs de l’ETH Zurich ont innové dans l’estimation de la profondeur monoculaire en modifiant le modèle open source Marigold à diffusion stable. Ce modèle atteint d'excellentes performances en ajustant avec précision le module U-Net de débruitage sans nécessiter de données réelles de formation d'image de profondeur. En s'entraînant sur les données synthétiques, Marigold peut apprendre un large éventail de scénarios et améliorer ses capacités de généralisation sur des ensembles de données invisibles. L'idée technique principale est d'utiliser les connaissances préalables de la diffusion stable et d'adopter la méthode d'estimation de profondeur affine et invariante pour éliminer l'erreur d'estimation de profondeur causée par l'incertitude des paramètres internes de la caméra.
Ce résultat de recherche fournit une nouvelle idée pour la technologie d'estimation de la profondeur monoculaire. Son efficacité élevée et sa capacité de généralisation devraient être largement utilisées dans des domaines tels que la conduite autonome et la navigation robotisée. Cette recherche démontre pleinement le potentiel du modèle de diffusion stable et sa valeur d'application dans la résolution de problèmes pratiques.