Dengan munculnya era multi-perangkat, adaptasi gambar dan video lintas platform telah menjadi kebutuhan yang mendesak. Cara menyesuaikan ukuran gambar secara otomatis dan efisien untuk beradaptasi dengan ukuran layar yang berbeda dan mempertahankan efek tampilan terbaik telah menjadi pusat penelitian di bidang pemrosesan gambar. Tim peneliti dari Universitas Sharjah di Uni Emirat Arab telah memberikan solusi inovatif berdasarkan pembelajaran mendalam, yang secara otomatis dapat memprediksi ukuran gambar optimal dan memilih teknologi pengalihan yang paling tepat, sehingga secara efektif mengurangi kehilangan informasi dan meningkatkan pengalaman pengguna.
Dengan pesatnya popularitas perangkat digital, cara mengadaptasi gambar dan video secara sempurna ke berbagai ukuran layar telah menjadi masalah yang mendesak untuk dipecahkan. Sebuah tim peneliti dari Universitas Sharjah di Uni Emirat Arab baru-baru ini menerbitkan penelitian yang menggunakan model pembelajaran mendalam untuk mengembangkan teknologi baru yang secara otomatis dapat memprediksi ukuran gambar optimal untuk mencapai tampilan mulus antar perangkat yang berbeda.
Inti dari penelitian ini adalah pemanfaatan teknologi transfer learning, dengan menggunakan model deep learning seperti Resnet18, DenseNet121 dan InceptionV3. Para peneliti mengatakan bahwa meskipun terdapat banyak teknologi penargetan ulang gambar, seringkali teknologi tersebut tidak dapat menyesuaikan ukuran gambar secara otomatis dan masih memerlukan intervensi manual. Hal ini mengakibatkan gambar mungkin tampak terpotong atau terdistorsi pada layar berbeda. Oleh karena itu, tim peneliti berharap dapat menemukan metode pengalihan gambar terbaik melalui cara otomatis untuk mengurangi kehilangan informasi dan menjaga kualitas gambar.
Untuk mencapai tujuan ini, para peneliti membuat kumpulan data yang berisi 46.716 gambar dengan resolusi berbeda yang melibatkan enam kategori teknik penargetan ulang. Melalui eksperimen, mereka menggunakan informasi kategori sebagai masukan ketiga sambil mengkodekan informasi resolusi sebagai saluran tambahan pada gambar. Setelah dievaluasi, hasilnya menunjukkan bahwa metode mereka mencapai skor F1 terbaik sebesar 90% dalam memilih teknik pengalihan yang tepat, yang menunjukkan efektivitas metode ini.
Tim peneliti percaya bahwa pembelajaran mendalam dapat secara otomatis mengekstraksi fitur gambar dan secara efektif menangkap hubungan yang kompleks, sehingga membuat klasifikasi metode penargetan ulang gambar menjadi lebih akurat. Meskipun batas waktu komersialisasi teknologi baru ini belum terungkap, mereka menyoroti perlunya penelitian lebih lanjut untuk mengembangkan model yang sepenuhnya mengotomatisasi pemilihan teknologi terbaik dan penargetan ulang gambar. Selain itu, mereka berencana untuk memperluas kumpulan data, menambahkan lebih banyak sampel, dan metode pengalihan untuk meningkatkan akurasi dan kemampuan beradaptasi model.
Penelitian ini memberikan solusi baru di bidang pemrosesan gambar, dan kami berharap dapat mencapai pengalihan gambar yang lebih efisien dan cerdas di masa depan.
Makalah: https://ieeexplore.ieee.org/document/10776979
Menyorot:
Tim peneliti mengembangkan teknologi pengalihan gambar otomatis berdasarkan pembelajaran mendalam yang dapat beradaptasi dengan mulus ke berbagai layar.
Model seperti Resnet18, DenseNet121, dan InceptionV3 digunakan untuk meningkatkan akurasi pemrosesan gambar secara signifikan.
Dengan memperluas kumpulan data dan penelitian lebih lanjut, tim berharap dapat mencapai solusi pemrosesan gambar otomatis yang lebih komprehensif.
Hasil penelitian ini memberikan ide baru untuk memecahkan masalah adaptasi gambar, dan akurasi serta otomatisasi yang tinggi membawa kemungkinan baru bagi pengembangan teknologi pemrosesan gambar di masa depan. Upaya selanjutnya yang dilakukan tim peneliti, terutama perluasan kumpulan data dan penyempurnaan model, akan semakin meningkatkan kepraktisan dan popularitas teknologi.