image-match ist ein einfaches (jetzt Python 3!) Paket zum Finden ungefährer Bildübereinstimmungen aus einem Korpus. Es ähnelt beispielsweise pHash, verfügt jedoch über ein Datenbank-Backend, das problemlos auf Milliarden von Bildern skaliert werden kann und anhaltend hohe Bilderinfügungsraten unterstützt: bis zu 10.000 Bilder/s in unserem Cluster!
BITTE BEACHTEN: Dieser Algorithmus soll nahezu doppelte Bilder finden – etwa bei der Erkennung von Urheberrechtsverletzungen. Es ist NICHT beabsichtigt, Bilder zu finden, die konzeptionell ähnlich sind. Weitere Erklärungen finden Sie in diesem Problem oder in diesem Video.
Basierend auf dem Artikel „An image signatur for any type of image“ von Wong et al. Es gibt eine vorhandene Referenzimplementierung, die Ihren Anforderungen möglicherweise besser entspricht.
Die Leute bei Pavlov haben eine hervorragende Containerversion von Image-Match zur einfachen Skalierung und Bereitstellung veröffentlicht.
Sobald Sie damit fertig sind, lesen Sie diese beiden (kurzen) Abschnitte der Dokumentation, um ein Gefühl dafür zu bekommen, wozu image-match in der Lage ist: