مستندات | الخلاف | تويتر | ينكدين
Albumentations هي مكتبة بايثون لتكبير الصور. يتم استخدام تكبير الصورة في مهام التعلم العميق ورؤية الكمبيوتر لزيادة جودة النماذج المدربة. الغرض من تكبير الصورة هو إنشاء عينات تدريبية جديدة من البيانات الموجودة.
فيما يلي مثال لكيفية تطبيق بعض التعزيزات على مستوى البكسل من الألبومات لإنشاء صور جديدة من الصورة الأصلية:
دعم كامل لرؤية الكمبيوتر : يعمل مع جميع مهام السيرة الذاتية الرئيسية بما في ذلك التصنيف والتجزئة (الدلالية والمثالية)، واكتشاف الأشياء، وتقدير الوضع.
واجهة برمجة تطبيقات بسيطة وموحدة : واجهة واحدة متسقة لجميع أنواع البيانات - صور RGB/تدرج الرمادي/متعددة الأطياف، والأقنعة، والمربعات المحيطة، ونقاط المفاتيح.
مكتبة التعزيز الغنية : أكثر من 70 عملية تكبير عالية الجودة لتحسين بيانات التدريب الخاصة بك.
سريعة : يتم تصنيفها باستمرار باعتبارها أسرع مكتبة تكبير، مع تحسينات لاستخدام الإنتاج.
تكامل التعلم العميق : يعمل مع PyTorch وTensorFlow وأطر العمل الأخرى. جزء من النظام البيئي PyTorch.
تم إنشاؤها بواسطة الخبراء : تم إنشاؤها بواسطة مطورين ذوي خبرة عميقة في رؤية الكمبيوتر ومسابقات التعلم الآلي.
تزدهر الألبومات بناءً على مساهمات المطورين. نحن نقدر الرعاة الذين يساعدون في الحفاظ على البنية التحتية للمشروع.
؟ الرعاة الذهبيون |
---|
شركتك يمكن أن تكون هنا |
؟ الرعاة الفضيون |
---|
؟ الرعاة البرونزيون |
---|
رعايتك هي وسيلة لقول "شكرًا" للمشرفين والمساهمين الذين يقضون أوقات فراغهم في بناء الألبومات وصيانتها. يتم عرض الجهات الراعية على موقعنا الإلكتروني وREADME. عرض مستويات الرعاية على رعاة GitHub
الزلال
معلومات النظام
المعلمات المرجعية
إصدارات المكتبة
التجزئة الدلالية في مجموعة بيانات Inria
التصوير الطبي
اكتشاف الكائنات والتجزئة الدلالية في مجموعة بيانات Mapillary Vistas
زيادة النقاط الرئيسية
التحويلات على مستوى البكسل
التحولات على المستوى المكاني
انظر أيضا
أنا جديد على تكبير الصور
أريد استخدام الألبومات لمهمة محددة مثل التصنيف أو التجزئة
أريد أن أعرف كيفية استخدام الألبومات مع أطر التعلم العميق
أريد استكشاف التعزيزات ورؤية الألبومات أثناء العمل
المشرف الحالي
أعضاء الفريق الأساسي الفخري
؟ كن راعيا
لماذا الألبومات
مشروع يحركه المجتمع، بدعم من
جدول المحتويات
المؤلفون
تثبيت
التوثيق
مثال بسيط
ابدء
من يستخدم الألبومات
قائمة الزيادات
بعض الأمثلة الإضافية على الزيادات
نتائج المقارنة
مقارنة الأداء
المساهمة
مجتمع
نقلا عن
فلاديمير آي إيجلوفيكوف | كاجل جراند ماستر
ميخائيل دروزينين | خبير كاجل
أليكس بارينوف | كاجل ماستر
الكسندر بوسلايف | كاجل ماستر
يوجين خفيدشينيا | كاجل جراند ماستر
تتطلب الألبومات إصدار Python 3.9 أو أعلى. لتثبيت أحدث إصدار من PyPI:
تثبيت النقطة -U ألبومات
يتم وصف خيارات التثبيت الأخرى في الوثائق.
الوثائق الكاملة متاحة على https://albumentations.ai/docs/ .
استيراد الألبومات كـ Aimport cv2# قم بتعريف خط أنابيب التكبير = A.Compose([A.RandomCrop(width=256, height=256),A.HorizontalFlip(p=0.5),A.RandomBrightnessContrast(p=0.2), ])# اقرأ الصورة باستخدام OpenCV وقم بتحويلها إلى RGB colorspaceimage = cv2.imread("image.jpg")image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# زيادة الصورة المحولة = تحويل(صورة=صورة)transformed_image = تم تحويله["صورة"]
يرجى البدء بالمقالات التمهيدية حول سبب أهمية تكبير الصورة وكيف يساعد ذلك في بناء نماذج أفضل.
إذا كنت تريد استخدام الألبومات لمهمة محددة مثل التصنيف أو التجزئة أو اكتشاف الكائنات، فارجع إلى مجموعة المقالات التي تحتوي على وصف متعمق لهذه المهمة. لدينا أيضًا قائمة من الأمثلة حول تطبيق الألبومات لحالات استخدام مختلفة.
لدينا أمثلة على استخدام Albumentations مع PyTorch وTensorFlow.
تحقق من العرض التوضيحي للمكتبة عبر الإنترنت. مع ذلك، يمكنك تطبيق التعزيزات على صور مختلفة ورؤية النتيجة. لدينا أيضًا قائمة بجميع التعزيزات المتاحة وأهدافها.
قائمة الأوراق التي تستشهد بالألبومات.
مشاريع مفتوحة المصدر تستخدم الألبومات.
ستعمل التحويلات على مستوى البكسل على تغيير الصورة المدخلة فقط وستترك أي أهداف إضافية مثل الأقنعة والمربعات المحيطة ونقاط المفاتيح دون تغيير. قائمة التحويلات على مستوى البكسل:
AdditiveNoise
AdvancedBlur
التباين التلقائي
طمس
كلاهي
قناة التسرب
ChannelShuffle
انحراف لوني
ColorJitter
إلغاء التركيز
تصغير الحجم
زخرف
معادلة
ادارة الاغذية والعقاقير
فانسيPCA
من تعويم
الضوضاء غاوس
غاوسيبلور
GlassBlur
HistogramMatching
HueSaturationValue
الضوضاء
إضاءة
ضغط الصور
عكس الصورة
MedianBlur
MotionBlur
الضوضاء المضاعفة
تطبيع
تعديل توزيع البكسل
بلانكيان جيتر
تباين سطوع البلازما
ظل البلازما
تتالي
RGBShift
تباين السطوع العشوائي
ضباب عشوائي
عشوائية جاما
RandomGravel
RandomRain
RandomShadow
RandomSnow
RandomSunFlare
RandomToneCurve
RingingOvershoot
ملح وفلفل
شحذ
طلقةالضوضاء
التشميس
ترشيش
بكسلات فائقة
تحويل القالب
TextImage
لتطفو
توغراي
toRGB
إلى سيبيا
UnsharpMask
ZoomBlur
ستعمل التحويلات على المستوى المكاني على تغيير كل من الصورة المدخلة بالإضافة إلى الأهداف الإضافية مثل الأقنعة والمربعات المحيطة ونقاط المفاتيح في نفس الوقت. يوضح الجدول التالي الأهداف الإضافية التي يدعمها كل تحويل.
تحويل | صورة | قناع | صناديق | النقاط الرئيسية |
---|---|---|---|---|
افين | ✓ | ✓ | ✓ | ✓ |
BBoxSafeRandomCrop | ✓ | ✓ | ✓ | ✓ |
CenterCrop | ✓ | ✓ | ✓ | ✓ |
التسرب الخشن | ✓ | ✓ | ✓ | ✓ |
اقتصاص | ✓ | ✓ | ✓ | ✓ |
CropAndPad | ✓ | ✓ | ✓ | ✓ |
CropNonEmptyMaskIfExists | ✓ | ✓ | ✓ | ✓ |
د4 | ✓ | ✓ | ✓ | ✓ |
تحويل مرن | ✓ | ✓ | ✓ | ✓ |
محو | ✓ | ✓ | ✓ | ✓ |
قناع التردد | ✓ | ✓ | ✓ | ✓ |
تشويه الشبكة | ✓ | ✓ | ✓ | ✓ |
GridDropout | ✓ | ✓ | ✓ | ✓ |
GridElasticDeform | ✓ | ✓ | ✓ | ✓ |
أفقيا فليب | ✓ | ✓ | ✓ | ✓ |
لامدا | ✓ | ✓ | ✓ | ✓ |
أطول حجم أقصى | ✓ | ✓ | ✓ | ✓ |
MaskDropout | ✓ | ✓ | ✓ | ✓ |
المورفولوجية | ✓ | ✓ | ✓ | ✓ |
لاOp | ✓ | ✓ | ✓ | ✓ |
التشويه البصري | ✓ | ✓ | ✓ | ✓ |
OverlayElements | ✓ | ✓ | ||
وسادة | ✓ | ✓ | ✓ | ✓ |
PadIfNeeded | ✓ | ✓ | ✓ | ✓ |
وجهة نظر | ✓ | ✓ | ✓ | ✓ |
PiecewiseAffine | ✓ | ✓ | ✓ | ✓ |
PixelDropout | ✓ | ✓ | ✓ | ✓ |
RandomCrop | ✓ | ✓ | ✓ | ✓ |
RandomCropFromBorders | ✓ | ✓ | ✓ | ✓ |
RandomCropNearBBox | ✓ | ✓ | ✓ | ✓ |
RandomGridShuffle | ✓ | ✓ | ✓ | ✓ |
RandomResizeCrop | ✓ | ✓ | ✓ | ✓ |
تدوير عشوائي90 | ✓ | ✓ | ✓ | ✓ |
مقياس عشوائي | ✓ | ✓ | ✓ | ✓ |
RandomSizedBBoxSafeCrop | ✓ | ✓ | ✓ | ✓ |
RandomSizedCrop | ✓ | ✓ | ✓ | ✓ |
تغيير الحجم | ✓ | ✓ | ✓ | ✓ |
تناوب | ✓ | ✓ | ✓ | ✓ |
تدوير آمن | ✓ | ✓ | ✓ | ✓ |
ShiftScaleRotate | ✓ | ✓ | ✓ | ✓ |
أصغر حجم أقصى | ✓ | ✓ | ✓ | ✓ |
ThinPlateSpline | ✓ | ✓ | ✓ | ✓ |
قناع الوقت | ✓ | ✓ | ✓ | ✓ |
TimeReverse | ✓ | ✓ | ✓ | ✓ |
تبديل | ✓ | ✓ | ✓ | ✓ |
فيرتيكال فليب | ✓ | ✓ | ✓ | ✓ |
XYMasking | ✓ | ✓ | ✓ | ✓ |
النظام الأساسي: macOS-15.0.1-arm64-arm-64bit
المعالج: ذراع
عدد وحدة المعالجة المركزية: 10
إصدار بايثون: 3.12.7
عدد الصور: 1000
عدد مرات التشغيل لكل تحويل: 10
الحد الأقصى لتكرارات الإحماء: 1000
الزلال: 1.4.20
أغسطس: 1.0.0
الصورة: 0.4.0
كورنيا: 0.7.3
رؤية الشعلة: 0.20.0
الرقم - هو عدد صور uint8 RGB التي تتم معالجتها في الثانية على نواة وحدة المعالجة المركزية (CPU) واحدة. الأعلى هو الأفضل.
تحويل | الزلال 1.4.20 | قبيح 1.0.0 | com.imgaug 0.4.0 | كورنيا 0.7.3 | com.torchvision 0.20.0 |
---|---|---|---|---|---|
أفقيا فليب | 8618 ± 1233 | 4807 ± 818 | 6042 ± 788 | 390 ± 106 | 914 ± 67 |
فيرتيكال فليب | 22847 ± 2031 | 9153 ± 1291 | 10931 ± 1844 | 1212 ± 402 | 3198 ± 200 |
تناوب | 1146 ± 79 | 1119 ± 41 | 1136 ± 218 | 143 ± 11 | 181 ± 11 |
افين | 682 ± 192 | - | 774 ± 97 | 147 ± 9 | 130 ± 12 |
معادلة | 892 ± 61 | - | 581 ± 54 | 152 ± 19 | 479 ± 12 |
RandomCrop80 | 47341 ± 20523 | 25272 ± 1822 | 11503 ± 441 | 1510 ± 230 | 32109 ± 1241 |
ShiftRGB | 2349 ± 76 | - | 1582 ± 65 | - | - |
تغيير الحجم | 2316 ± 166 | 611 ± 78 | 1806 ± 63 | 232 ± 24 | 195 ± 4 |
عشوائية جاما | 8675 ± 274 | - | 2318 ± 269 | 108 ± 13 | - |
تدرج الرمادي | 3056 ± 47 | 2720 ± 932 | 1681 ± 156 | 289 ± 75 | 1838 ± 130 |
منظور عشوائي | 412 ± 38 | - | 554 ± 22 | 86 ± 11 | 96 ± 5 |
غاوسيبلور | 1728 ± 89 | 242 ± 4 | 1090 ± 65 | 176 ± 18 | 79 ± 3 |
MedianBlur | 868 ± 60 | - | 813 ± 30 | 5 ± 0 | - |
MotionBlur | 4047 ± 67 | - | 612 ± 18 | 73 ± 2 | - |
تتالي | 9094 ± 301 | - | 2097 ± 68 | 430 ± 49 | 3196 ± 185 |
ضغط Jpeg | 918 ± 23 | 778 ± 5 | 459 ± 35 | 71 ± 3 | 625 ± 17 |
الضوضاء الغوسية | 166 ± 12 | 67 ± 2 | 206 ± 11 | 75 ± 1 | - |
مرن | 201 ± 5 | - | 235 ± 20 | 1 ± 0 | 2 ± 0 |
كلاهي | 454 ± 22 | - | 335 ± 43 | 94 ± 9 | - |
التسرب الخشن | 13368 ± 744 | - | 671 ± 38 | 536 ± 87 | - |
طمس | 5267 ± 543 | 246 ± 3 | 3807 ± 325 | - | - |
ColorJitter | 628 ± 55 | 255 ± 13 | - | 55 ± 18 | 46 ± 2 |
سطوع | 8956 ± 300 | 1163 ± 86 | - | 472 ± 101 | 429 ± 20 |
مقابلة | 8879 ± 1426 | 736 ± 79 | - | 425 ± 52 | 335 ± 35 |
RandomResizeCrop | 2828 ± 186 | - | - | 287 ± 58 | 511 ± 10 |
تطبيع | 1196 ± 56 | - | - | 626 ± 40 | 519 ± 12 |
PlankianJitter | 2204 ± 385 | - | - | 813 ± 211 | - |
لإنشاء طلب سحب إلى المستودع، اتبع الوثائق الموجودة على CONTRIBUTING.md
ينكدين
تغريد
الفتنة
إذا وجدت هذه المكتبة مفيدة لبحثك، يرجى التفكير في الاستشهاد بألبومات: تكبيرات الصور السريعة والمرنة:
@Article{info11020125,AUTHOR = {Buslaev, Alexander and Iglovikov, فلاديمير I. وKhvedchenya, يوجين وبارينوف, Alex and Druzhinin, Mikhail and Kalinin, Alexandr A.},TITLE = {Albumentations: تعزيزات سريعة ومرنة للصور},JOURNAL = {المعلومات}، الحجم = {11}، السنة = {2020}، الرقم = {2}، رقم المقالة = {125}، URL = {https://www.mdpi.com/2078-2489/11/2/125}، ISSN = {2078-2489}، DOI = {10.3390/info11020125}}