Com o advento da era dos vários dispositivos, a adaptação de imagens e vídeos entre plataformas tornou-se uma necessidade urgente. Como ajustar o tamanho da imagem de forma automática e eficiente para se adaptar a diferentes tamanhos de tela e manter o melhor efeito de exibição tornou-se um ponto importante de pesquisa na área de processamento de imagens. Uma equipe de pesquisa da Universidade de Sharjah, nos Emirados Árabes Unidos, forneceu uma solução inovadora baseada em aprendizagem profunda, que pode prever automaticamente o tamanho ideal das imagens e selecionar a tecnologia de redirecionamento mais apropriada, reduzindo efetivamente a perda de informações e melhorando a experiência do usuário.
Com a rápida popularidade dos dispositivos digitais, como adaptar perfeitamente imagens e vídeos a vários tamanhos de tela tornou-se um problema urgente a ser resolvido. Uma equipe de pesquisa da Universidade de Sharjah, nos Emirados Árabes Unidos, publicou recentemente um estudo usando um modelo de aprendizagem profunda para desenvolver uma nova tecnologia que pode prever automaticamente o tamanho ideal das imagens para obter uma exibição perfeita entre diferentes dispositivos.
O núcleo desta pesquisa é o uso de tecnologia de aprendizagem por transferência, utilizando modelos de aprendizagem profunda como Resnet18, DenseNet121 e InceptionV3. Os pesquisadores disseram que, embora existam muitas tecnologias de retargeting de imagem, elas muitas vezes não conseguem ajustar automaticamente o tamanho da imagem e ainda exigem intervenção manual. Isso resulta em imagens que podem aparecer cortadas ou distorcidas em telas diferentes. Portanto, a equipe de pesquisa espera encontrar o melhor método de redirecionamento de imagens por meios automatizados para reduzir a perda de informações e manter a qualidade da imagem.
Para atingir esse objetivo, os pesquisadores construíram um conjunto de dados contendo 46.716 imagens de diferentes resoluções envolvendo seis categorias de técnicas de retargeting. Através de experimentos, eles usaram informações de categoria como uma terceira entrada enquanto codificavam informações de resolução como um canal adicional da imagem. Após avaliação, os resultados mostram que o seu método atinge a melhor pontuação F1 de 90% na seleção de técnicas de redirecionamento apropriadas, indicando a eficácia deste método.
A equipe de pesquisa acredita que o aprendizado profundo pode extrair automaticamente recursos de imagem e capturar efetivamente relacionamentos complexos, tornando assim a classificação dos métodos de retargeting de imagem mais precisa. Embora o cronograma de comercialização da nova tecnologia ainda não tenha sido revelado, eles destacaram a necessidade de mais pesquisas para desenvolver modelos que automatizem totalmente a seleção da melhor tecnologia e o redirecionamento de imagens. Além disso, planejam expandir o conjunto de dados, adicionando mais amostras e métodos de redirecionamento para melhorar a precisão e adaptabilidade do modelo.
Esta pesquisa fornece novas soluções para a área de processamento de imagens e esperamos alcançar um redirecionamento de imagens mais eficiente e inteligente no futuro.
Artigo: https://ieeexplore.ieee.org/document/10776979
Destaque:
A equipe de pesquisa desenvolveu uma tecnologia de redirecionamento automático de imagens baseada em aprendizado profundo que pode se adaptar perfeitamente a diferentes telas.
Modelos como Resnet18, DenseNet121 e InceptionV3 são usados para melhorar significativamente a precisão do processamento de imagens.
Ao expandir o conjunto de dados e pesquisas adicionais, a equipe espera alcançar uma solução de processamento automatizado de imagens mais abrangente.
O resultado desta pesquisa fornece uma nova ideia para resolver o problema de adaptação de imagens, e sua alta precisão e automação trazem novas possibilidades para o desenvolvimento de futuras tecnologias de processamento de imagens. Os esforços subsequentes da equipa de investigação, especialmente a expansão do conjunto de dados e a melhoria do modelo, irão aumentar ainda mais a praticidade e popularidade da tecnologia.