مع ظهور عصر الأجهزة المتعددة، أصبح التكيف عبر الأنظمة الأساسية للصور ومقاطع الفيديو حاجة ملحة. أصبحت كيفية ضبط حجم الصورة تلقائيًا وفعالاً للتكيف مع أحجام الشاشات المختلفة والحفاظ على أفضل تأثير للعرض نقطة اهتمام بحثية في مجال معالجة الصور. قدم فريق بحثي من جامعة الشارقة في دولة الإمارات العربية المتحدة حلاً مبتكراً يعتمد على التعلم العميق، والذي يمكنه التنبؤ تلقائياً بالحجم الأمثل للصور واختيار تقنية إعادة التوجيه الأنسب، مما يقلل بشكل فعال من فقدان المعلومات ويحسن تجربة المستخدم.
مع الانتشار السريع للأجهزة الرقمية، أصبحت كيفية تكييف الصور ومقاطع الفيديو بشكل مثالي مع أحجام الشاشات المختلفة مشكلة ملحة يجب حلها. نشر فريق بحثي من جامعة الشارقة في دولة الإمارات العربية المتحدة مؤخراً دراسة باستخدام نموذج التعلم العميق لتطوير تقنية جديدة يمكنها التنبؤ تلقائياً بالحجم الأمثل للصور لتحقيق عرض سلس بين الأجهزة المختلفة.
جوهر هذا البحث هو استخدام تكنولوجيا التعلم النقلي، وذلك باستخدام نماذج التعلم العميق مثل Resnet18 وDenseNet121 وInceptionV3. وقال الباحثون إنه على الرغم من وجود العديد من تقنيات إعادة استهداف الصور الحالية، إلا أنها في كثير من الأحيان لا تستطيع ضبط حجم الصورة تلقائيًا ولا تزال تتطلب تدخلاً يدويًا. وينتج عن ذلك صور قد تظهر مقطوعة أو مشوهة على شاشات مختلفة. ولذلك يأمل الفريق البحثي في إيجاد أفضل طريقة لإعادة توجيه الصورة من خلال الوسائل الآلية لتقليل فقدان المعلومات والحفاظ على جودة الصورة.
ولتحقيق هذا الهدف، أنشأ الباحثون مجموعة بيانات تحتوي على 46,716 صورة ذات دقة مختلفة تتضمن ست فئات من تقنيات إعادة الاستهداف. ومن خلال التجارب، استخدموا معلومات الفئة كمدخل ثالث أثناء تشفير معلومات الدقة كقناة إضافية للصورة. وبعد التقييم أظهرت النتائج أن أسلوبهم يحقق أفضل درجة F1 بنسبة 90% في اختيار تقنيات إعادة التوجيه المناسبة، مما يدل على فعالية هذا الأسلوب.
ويعتقد فريق البحث أن التعلم العميق يمكنه استخراج ميزات الصورة تلقائيًا والتقاط العلاقات المعقدة بشكل فعال، مما يجعل تصنيف طرق إعادة استهداف الصور أكثر دقة. على الرغم من أنه لم يتم الكشف بعد عن جدول زمني لتسويق التكنولوجيا الجديدة، إلا أنهم سلطوا الضوء على الحاجة إلى مزيد من البحث لتطوير نماذج تعمل على أتمتة عملية اختيار أفضل التقنيات وإعادة استهداف الصور بشكل كامل. بالإضافة إلى ذلك، يخططون لتوسيع مجموعة البيانات، وإضافة المزيد من العينات وطرق إعادة التوجيه لتحسين دقة النموذج وقابليته للتكيف.
يقدم هذا البحث حلولاً جديدة في مجال معالجة الصور، ونحن نتطلع إلى تحقيق إعادة توجيه أكثر كفاءة وذكاءً للصور في المستقبل.
الورقة: https://ieeeexplore.ieee.org/document/10776979
تسليط الضوء على:
قام فريق البحث بتطوير تقنية إعادة توجيه الصور تلقائيًا بناءً على التعلم العميق الذي يمكنه التكيف بسلاسة مع الشاشات المختلفة.
تُستخدم نماذج مثل Resnet18 وDenseNet121 وInceptionV3 لتحسين دقة معالجة الصور بشكل ملحوظ.
ومن خلال توسيع مجموعة البيانات وإجراء المزيد من الأبحاث، يأمل الفريق في تحقيق حل أكثر شمولاً لمعالجة الصور الآلية.
توفر نتيجة البحث هذه فكرة جديدة لحل مشكلة التكيف مع الصورة، كما أن دقتها العالية وأتمتتها توفر إمكانيات جديدة لتطوير تكنولوجيا معالجة الصور المستقبلية. إن الجهود اللاحقة التي يبذلها فريق البحث، وخاصة توسيع مجموعة البيانات وتحسين النموذج، ستعزز من التطبيق العملي لهذه التكنولوجيا وشعبيتها.