imagededup عبارة عن حزمة بيثون تعمل على تبسيط مهمة العثور على التكرارات الدقيقة والقريبة في مجموعة الصور.
توفر هذه الحزمة وظائف للاستفادة من خوارزميات التجزئة التي تعتبر جيدة بشكل خاص في العثور على التكرارات الدقيقة بالإضافة إلى الشبكات العصبية التلافيفية التي تتميز أيضًا بالمهارة في العثور على التكرارات القريبة. يتم أيضًا توفير إطار تقييم للحكم على جودة إلغاء البيانات المكررة لمجموعة بيانات معينة.
فيما يلي تفاصيل الوظائف التي توفرها الحزمة:
يمكن العثور على الوثائق التفصيلية للحزمة على: https://idealo.github.io/imagededup/
imagededup متوافق مع Python 3.8+ ويعمل على Linux وMacOS X وWindows. يتم توزيعه بموجب ترخيص Apache 2.0.
هناك طريقتان لتثبيت imagededup:
pip install imagededup
git clone https://github.com/idealo/imagededup.git
cd imagededup
pip install " cython>=0.29 "
python setup.py install
من أجل العثور على التكرارات في دليل الصورة باستخدام التجزئة الإدراكية، يمكن استخدام سير العمل التالي:
from imagededup . methods import PHash
phasher = PHash ()
encodings = phasher . encode_images ( image_dir = 'path/to/image/directory' )
duplicates = phasher . find_duplicates ( encoding_map = encodings )
from imagededup . utils import plot_duplicates
plot_duplicates ( image_dir = 'path/to/image/directory' ,
duplicate_map = duplicates ,
filename = 'ukbench00120.jpg' )
يبدو الإخراج كما يلي:
الكود الكامل لسير العمل هو:
from imagededup . methods import PHash
phasher = PHash ()
# Generate encodings for all images in an image directory
encodings = phasher . encode_images ( image_dir = 'path/to/image/directory' )
# Find duplicates using the generated encodings
duplicates = phasher . find_duplicates ( encoding_map = encodings )
# plot duplicates obtained for a given file using the duplicates dictionary
from imagededup . utils import plot_duplicates
plot_duplicates ( image_dir = 'path/to/image/directory' ,
duplicate_map = duplicates ,
filename = 'ukbench00120.jpg' )
من الممكن أيضًا استخدام النماذج المخصصة الخاصة بك للعثور على التكرارات باستخدام طريقة CNN.
على سبيل المثال، راجع هذا الجزء من المستودع.
لمزيد من التفاصيل حول استخدام وظيفة الحزمة، راجع: https://idealo.github.io/imagededup/
التحديث : المعايير المقدمة صالحة فقط حتى imagededup v0.2.2
. تحتوي الإصدارات القادمة على تغييرات كبيرة في جميع الأساليب، لذلك قد لا تصمد المعايير الحالية.
تم توفير معايير تفصيلية بشأن مقاييس السرعة والتصنيف لأساليب مختلفة في الوثائق. وبشكل عام يمكن التوصل إلى الاستنتاجات التالية:
نحن نرحب بجميع أنواع المساهمات. راجع دليل المساهمة لمزيد من التفاصيل.
يرجى ذكر Imagededup في منشوراتك إذا كان ذلك مفيدًا لبحثك. فيما يلي مثال لإدخال BibTeX:
@misc { idealods2019imagededup ,
title = { Imagededup } ,
author = { Tanuj Jain and Christopher Lennan and Zubin John and Dat Tran } ,
year = { 2019 } ,
howpublished = { url{https://github.com/idealo/imagededup} } ,
}
راجع الترخيص للحصول على التفاصيل.