أعلن فريق أبحاث ديزني مؤخرًا عن تكنولوجيا ضغط الصور المبتكرة التي تقلل بشكل كبير من معدلات نقل البيانات مع ضمان جودة الصورة. تقوم هذه التكنولوجيا بإعادة بناء تفاصيل الصورة الأكثر واقعية بمعدلات منخفضة من خلال الجمع الذكي بين خطأ الكمي ومعالجة الضوضاء ، وتلقى تصنيفات أعلى في اختبار تجربة المستخدم من المنافسين. بالمقارنة مع برامج الترميز التقليدية مثل JPEG و AV1 ، على الرغم من تحسن تعقيدها ، فإن مزاياها في جودة الصورة وكفاءة المعالجة أكثر أهمية ، والتي لها أهمية كبيرة في مجال تخزين الصور ونقلها.
أصدرت شركة Disney Research مؤخرًا تقنية مبتكرة لضغط الصور يمكنها توليد تأثيرات أكثر واقعية للصور مع الحفاظ على معدلات نقل البيانات المنخفضة.
على الرغم من أن تقنية الترميز الجديدة قد أدت إلى تحسين التعقيد مقارنةً برموز الترميز التقليدية مثل JPEG و AV1 ، فقد أظهرت مزايا كبيرة في جودة الصورة وكفاءة المعالجة. وجد فريق البحث أنه من خلال الجمع بين خطأ الكمي ومع معالجة الضوضاء في معالجة الصور ، يمكن إعادة بناء تفاصيل الصورة بشكل أفضل بمعدل البت المستهدف.
مقارنة طريقة ضغط ديزني مع الطرق السابقة. يدعي المؤلف أن الانتعاش التفاصيل قد تحسن مع توفير نموذج لا يتطلب مئات الآلاف من الدولارات في التدريب ويعمل بشكل أسرع من أقرب طريقة المنافسة المكافئة.
وقال الباحثون إن التكنولوجيا الجديدة لا تتطلب سوى أقل من 10 ٪ من عملية المعالجة الكاملة ولا تتطلب تغييرات كبيرة في بنية النظام. في الاختبار الفعلي ، لا تزال جودة الصورة التي أعيد بناؤها بواسطة هذه التقنية أكثر شعبية لدى المستخدمين النهائيين حتى لو كانت طرق الضغط الأخرى تستخدم ضعف معدل البت.
ومع ذلك ، فإن هذه التكنولوجيا لديها أيضا بعض القيود. في بعض الحالات المحددة ، قد تواجه الصورة التي أعيد بناؤها عدم دقة خفية ، مثل منحنى طفيف من الخطوط المستقيمة أو تشويه طفيف لحدود الكائنات الصغيرة. تنبع هذه المشكلات بشكل أساسي من قيود أبعاد ميزة النظام.
في اختبار التطبيق العملي ، استخدم فريق البحث مجموعات بيانات متعددة للتقييم ، بما في ذلك Kodak و CLIC2022 و COCO30K. تغطي مؤشرات التقييم أبعاد متعددة مثل نسبة الإشارة إلى الضوضاء الذروة (PSNR) ، ومؤشر التشابه المتصور (LPIPs) ، ومؤشر التشابه الهيكلي متعدد النطاق (MS-SSIM) ، والمسافة الأولية Fréchet (FID).
قارن بشكل إضافي نهج ديزني الجديد (الذي تم تسليط الضوء عليه باللون الأخضر) مع مقاربات أخرى.
تتبنى أبحاث المستخدم طريقة اختيار إلزامية ويتم تقييمها من خلال نظام تصنيف ELO مشابه لبطولة الشطرنج. تظهر النتائج أنه حتى مع وجود منافسين يستخدمون ضعف كمية البيانات ، لا تزال التكنولوجيا الجديدة من ديزني تحصل على تصنيفات مستخدم أعلى بكثير.
من حيث سرعة المعالجة ، تحسنت التكنولوجيا الجديدة بشكل كبير مقارنة بمنافسيها الرئيسيين ، مع اختصار وقت المعالجة من 6.87 ثانية إلى 3.49 ثانية. هذا التحسن في الكفاءة ، إلى جانب تأثير ضغط ممتاز ، يجعل هذه التكنولوجيا لها قيمة تطبيق مهمة في مجالات تخزين الصور ونقلها.
تجدر الإشارة إلى أن تطوير تكنولوجيا ضغط الصور له أهمية كبيرة لحل المشكلات مثل تخزين البيانات العالمي ، وتدفق نقل الوسائط واستهلاك الطاقة. على الرغم من أن أفضل حلول التكنولوجيا لا تحصل دائمًا على أوسع اعتراف في السوق ، فإن ابتكار ديزني هذا يوفر للصناعة حلًا يلفت توازنًا جيدًا بين الكفاءة والأداء.
باختصار ، حققت تقنية ضغط الصور من ديزني اختراقات كبيرة في الكفاءة وجودة الصورة ، مما جلب إمكانيات جديدة إلى مجال معالجة الصور ، والتطورات المستقبلية تستحق التطلع إليها.