En los últimos años, el aprendizaje profundo ha logrado avances significativos en el campo de la comparación de imágenes, pero la generalización de modelos sigue siendo un desafío. Para resolver este problema, investigadores de la Universidad de Xiamen, Intel y DJI propusieron un nuevo método: GIM (Learning Generalizable Image Matcher from Internet Videos). Esta investigación tiene como objetivo mejorar la capacidad de generalización de los modelos de coincidencia de imágenes para que puedan adaptarse mejor a diversos escenarios y datos. GIM utiliza videos de Internet para la capacitación y propone por primera vez el punto de referencia de evaluación de disparo cero (ZEB) para evaluar el rendimiento de generalización del modelo. Se espera que este método mejore significativamente la practicidad y confiabilidad de la tecnología de comparación de imágenes y aporte nuevos avances al campo de la visión por computadora.
La comparación de imágenes es una tarea básica de la visión por computadora. En los últimos años, los modelos de comparación basados en el aprendizaje profundo se han vuelto cada vez más populares. Para resolver el problema de la generalización de los métodos de aprendizaje profundo, investigadores de la Universidad de Xiamen, Intel y DJI propusieron GIM: Learning Generalizable Image Matcher from Internet Videos. GIM permite que los modelos coincidentes aprendan sólidas capacidades de generalización a partir de videos de Internet y es adecuado para entrenar todos los modelos coincidentes. El autor propuso el primer punto de referencia de evaluación de tiro cero (ZEB). Los resultados de la evaluación muestran que GIM puede mejorar significativamente el rendimiento de generalización del modelo de coincidencia.
La aparición de GIM proporciona nuevas ideas para mejorar la capacidad de generalización de los modelos de coincidencia de imágenes, y su excelente rendimiento en el punto de referencia de evaluación Zero-shot también demuestra su eficacia. El resultado de esta investigación es de gran importancia para promover el progreso y la aplicación de la tecnología de comparación de imágenes y merece más atención e investigación.