image-match est un package simple (maintenant Python 3 !) permettant de trouver des correspondances d'images approximatives à partir d'un corpus. Il est similaire, par exemple, à pHash, mais comprend une base de données backend qui s'adapte facilement à des milliards d'images et prend en charge des taux d'insertion d'images élevés et soutenus : jusqu'à 10 000 images/s sur notre cluster !
VEUILLEZ NOTER : Cet algorithme est destiné à trouver des images presque en double – pensez à la détection des violations de droits d'auteur. Il n’est PAS destiné à trouver des images conceptuellement similaires. Pour plus d'explications, consultez ce problème ou cette vidéo.
Basé sur l'article Une signature d'image pour tout type d'image , Wong et al. Il existe une implémentation de référence existante qui peut être plus adaptée à vos besoins.
Les gens de Pavlov ont publié une excellente version conteneurisée d'image-match pour une mise à l'échelle et un déploiement faciles.
Une fois que vous êtes opérationnel, lisez ces deux (courtes) sections de la documentation pour avoir une idée de ce dont image-match est capable :