Con la llegada de la era multidispositivo, la adaptación multiplataforma de imágenes y vídeos se ha convertido en una necesidad urgente. Cómo ajustar de forma automática y eficiente el tamaño de la imagen para adaptarse a diferentes tamaños de pantalla y mantener el mejor efecto de visualización se ha convertido en un punto de investigación en el campo del procesamiento de imágenes. Un equipo de investigación de la Universidad de Sharjah en los Emiratos Árabes Unidos ha proporcionado una solución innovadora basada en el aprendizaje profundo, que puede predecir automáticamente el tamaño óptimo de las imágenes y seleccionar la tecnología de redireccionamiento más adecuada, reduciendo efectivamente la pérdida de información y mejorando la experiencia del usuario.
Con la rápida popularidad de los dispositivos digitales, cómo adaptar perfectamente imágenes y vídeos a varios tamaños de pantalla se ha convertido en un problema urgente que hay que resolver. Un equipo de investigación de la Universidad de Sharjah en los Emiratos Árabes Unidos publicó recientemente un estudio que utiliza un modelo de aprendizaje profundo para desarrollar una nueva tecnología que puede predecir automáticamente el tamaño óptimo de las imágenes para lograr una visualización perfecta entre diferentes dispositivos.
El núcleo de esta investigación es el uso de tecnología de aprendizaje por transferencia, utilizando modelos de aprendizaje profundo como Resnet18, DenseNet121 e InceptionV3. Los investigadores dijeron que, aunque existen muchas tecnologías de reorientación de imágenes, a menudo no pueden ajustar automáticamente el tamaño de la imagen y aún requieren intervención manual. Esto da como resultado imágenes que pueden aparecer recortadas o distorsionadas en diferentes pantallas. Por lo tanto, el equipo de investigación espera encontrar el mejor método de redirección de imágenes a través de medios automatizados para reducir la pérdida de información y mantener la calidad de la imagen.
Para lograr este objetivo, los investigadores construyeron un conjunto de datos que contiene 46.716 imágenes de diferentes resoluciones que involucran seis categorías de técnicas de retargeting. A través de experimentos, utilizaron información de categoría como una tercera entrada mientras codificaban información de resolución como un canal adicional de la imagen. Después de la evaluación, los resultados muestran que su método logra la mejor puntuación F1 del 90% en la selección de técnicas de redirección apropiadas, lo que indica la efectividad de este método.
El equipo de investigación cree que el aprendizaje profundo puede extraer automáticamente características de la imagen y capturar relaciones complejas de manera efectiva, lo que hace que la clasificación de los métodos de retargeting de imágenes sea más precisa. Si bien aún no se ha revelado un cronograma de comercialización para la nueva tecnología, resaltaron la necesidad de realizar más investigaciones para desarrollar modelos que automaticen completamente la selección de la mejor tecnología y la reorientación de imágenes. Además, planean ampliar el conjunto de datos, agregando más muestras y métodos de redirección para mejorar la precisión y adaptabilidad del modelo.
Esta investigación proporciona nuevas soluciones para el campo del procesamiento de imágenes y esperamos lograr una redirección de imágenes más eficiente e inteligente en el futuro.
Documento: https://ieeexplore.ieee.org/document/10776979
Destacar:
El equipo de investigación desarrolló una tecnología de redirección automática de imágenes basada en el aprendizaje profundo que puede adaptarse perfectamente a diferentes pantallas.
Se utilizan modelos como Resnet18, DenseNet121 e InceptionV3 para mejorar significativamente la precisión del procesamiento de imágenes.
Al ampliar el conjunto de datos y seguir investigando, el equipo espera lograr una solución de procesamiento automatizado de imágenes más completa.
El resultado de esta investigación proporciona una nueva idea para resolver el problema de la adaptación de imágenes, y su alta precisión y automatización brindan nuevas posibilidades para el desarrollo de futuras tecnologías de procesamiento de imágenes. Los esfuerzos posteriores del equipo de investigación, especialmente la expansión del conjunto de datos y la mejora del modelo, mejorarán aún más la practicidad y popularidad de la tecnología.