هذا هو تطبيق Tensorflow لتعلم الرؤية في الظلام في CVPR 2018، بواسطة Chen Chen وQifeng Chen وJia Xu وVladlen Koltun.
موقع المشروع
ورق
يتضمن هذا الرمز النموذج الافتراضي للتدريب والاختبار على مجموعة بيانات See-in-the-Dark (SID).
https://youtu.be/qWKUFK7MWvg
مكتبات بايثون (الإصدار 2.7) المطلوبة: Tensorflow (>=1.1) + Scipy + Numpy + Rawpy.
تم الاختبار في Ubuntu + Intel i7 CPU + Nvidia Titan X (Pascal) مع Cuda (>=8.0) وCuDNN (>=5.0). يجب أن يعمل وضع وحدة المعالجة المركزية أيضًا مع تغييرات طفيفة ولكن لم يتم اختباره.
تحديث أغسطس 2018: وجدنا بعض عدم التوافق مع الحقيقة الأساسية للصورة 10034، 10045، 10172. يرجى إزالة هذه الصور للحصول على نتائج كمية، ولكن لا يزال من الممكن استخدامها للتقييمات النوعية.
يمكنك تنزيله مباشرة من Google Drive لجهازي Sony (25 جيجابايت) وFuji (52 جيجابايت).
يوجد حد للتنزيل بواسطة Google Drive خلال فترة زمنية محددة. إذا لم تتمكن من التنزيل لهذا السبب، فجرّب هذه الروابط: Sony (25 جيجابايت) وFuji (52 جيجابايت).
جديد: نحن نقدم أجزاء الملفات في Baidu Drive الآن. بعد تنزيل جميع الأجزاء، يمكنك دمجها معًا عن طريق تشغيل: "cat SonyPart* > Sony.zip" و"cat FujiPart* > Fuji.zip".
يتم توفير قوائم الملفات. في كل صف، يوجد مسار صورة قصير التعريض، ومسار صورة طويل التعرض، ورقم ISO وF للكاميرا. لاحظ أن الصور المتعددة ذات التعريض القصير قد تتوافق مع نفس الصورة ذات التعريض الطويل.
يحتوي اسم الملف على معلومات الصورة. على سبيل المثال، في "10019_00_0.033s.RAF"، الرقم الأول "1" يعني أنه من مجموعة الاختبار ("0" لمجموعة التدريب و"2" لمجموعة التحقق من الصحة)؛ "0019" هو معرف الصورة؛ "00" التالي هو الرقم الموجود في التسلسل/الاندفاع؛ "0.033 ثانية" هو وقت التعرض 1/30 ثانية.
python download_models.py
افتراضيًا، يأخذ الكود البيانات الموجودة في المجلد "./dataset/Sony/" و"./dataset/Fuji/". إذا قمت بحفظ مجموعة البيانات في مجلدات أخرى، يرجى تغيير "input_dir" و"gt_dir" في بداية الكود.
افتراضيًا، يأخذ الكود البيانات الموجودة في المجلد "./dataset/Sony/" و"./dataset/Fuji/". إذا قمت بحفظ مجموعة البيانات في مجلدات أخرى، يرجى تغيير "input_dir" و"gt_dir" في بداية الكود.
يستغرق تحميل البيانات الأولية ومعالجتها بواسطة Rawpy وقتًا أطول بكثير من الانتشار العكسي. افتراضيًا، سيقوم الكود بتحميل جميع بيانات الحقيقة الأساسية التي تمت معالجتها بواسطة Rawpy في الذاكرة دون تكميم 8 بت أو 16 بت. يتطلب هذا ما لا يقل عن 64 جيجابايت من ذاكرة الوصول العشوائي لتدريب طراز Sony و128 جيجابايت من ذاكرة الوصول العشوائي لطراز Fuji. إذا كنت بحاجة إلى تدريبه على جهاز به ذاكرة وصول عشوائي أقل، فقد تحتاج إلى مراجعة الكود واستخدام بيانات الحقيقة الموجودة على القرص. نحن نقدم صورًا أساسية بحجم 16 بت تمت معالجتها بواسطة Rawpy: Sony (12 جيجابايت) وFuji (22 جيجابايت).
إذا كنت تستخدم الكود ومجموعة البيانات الخاصة بنا للبحث، فيرجى الاستشهاد بمقالتنا:
تشين تشين، كيفنغ تشين، جيا شو، وفلادلين كولتون، "تعلم الرؤية في الظلام"، في CVPR، 2018.
رخصة معهد ماساتشوستس للتكنولوجيا.
تم تصميم الطريقة المقترحة للبيانات الأولية للاستشعار. ربما لا يعمل النموذج المُدرب مسبقًا مع البيانات الواردة من مستشعر كاميرا آخر. ليس لدينا دعم لبيانات الكاميرا الأخرى. كما أنه لا يعمل مع الصور بعد مزود خدمة الإنترنت للكاميرا، أي بيانات JPG أو PNG.
هذا مشروع بحثي ونموذج أولي لإثبات المفهوم.
بشكل عام، تحتاج فقط إلى طرح مستوى اللون الأسود المناسب وحزم البيانات بنفس طريقة بيانات Sony/Fuji. إذا كنت تستخدم Rawpy، فستحتاج إلى قراءة المستوى الأسود بدلاً من استخدام 512 في الكود المقدم. قد يختلف نطاق البيانات أيضًا إذا لم يكن 14 بت. تحتاج إلى تطبيعه إلى [0,1] لإدخال الشبكة.
غالبًا ما يكون ذلك بسبب عدم تنزيل النموذج المُدرب مسبقًا بشكل صحيح. بعد التنزيل، يجب أن تحصل على 4 ملفات متعلقة بنقاط التفتيش للنموذج.
إذا كانت لديك أسئلة إضافية بعد قراءة الأسئلة الشائعة، فيرجى إرسال بريد إلكتروني إلى [email protected].