С наступлением эпохи использования нескольких устройств насущной необходимостью стала кроссплатформенная адаптация изображений и видео. Способы автоматической и эффективной настройки размера изображения для адаптации к различным размерам экрана и поддержания наилучшего эффекта отображения стали горячей точкой исследований в области обработки изображений. Исследовательская группа из Университета Шарджи в Объединенных Арабских Эмиратах предоставила инновационное решение, основанное на глубоком обучении, которое может автоматически прогнозировать оптимальный размер изображений и выбирать наиболее подходящую технологию перенаправления, эффективно сокращая потери информации и улучшая взаимодействие с пользователем.
В связи с быстрой популярностью цифровых устройств вопрос о том, как идеально адаптировать изображения и видео к экранам различных размеров, стал актуальной проблемой, которую необходимо решить. Исследовательская группа из Университета Шарджи в Объединенных Арабских Эмиратах недавно опубликовала исследование, использующее модель глубокого обучения для разработки новой технологии, которая может автоматически прогнозировать оптимальный размер изображений для обеспечения плавного отображения между различными устройствами.
В основе этого исследования лежит использование технологии трансферного обучения с использованием таких моделей глубокого обучения, как Resnet18, DenseNet121 и InceptionV3. Исследователи заявили, что, хотя существует множество технологий ретаргетинга изображений, они часто не могут автоматически регулировать размер изображения и по-прежнему требуют ручного вмешательства. В результате изображения могут выглядеть обрезанными или искаженными на разных экранах. Поэтому исследовательская группа надеется найти лучший метод перенаправления изображений с помощью автоматизированных средств, чтобы уменьшить потери информации и сохранить качество изображения.
Для достижения этой цели исследователи создали набор данных, содержащий 46 716 изображений различного разрешения, использующих шесть категорий методов ретаргетинга. В ходе экспериментов они использовали информацию о категории в качестве третьего входа, а информацию о разрешении кодировали в качестве дополнительного канала изображения. После оценки результаты показывают, что их метод достигает наилучшего показателя F1 (90%) при выборе подходящих методов перенаправления, что указывает на эффективность этого метода.
Исследовательская группа считает, что глубокое обучение может автоматически извлекать особенности изображения и эффективно фиксировать сложные взаимосвязи, тем самым делая классификацию методов ретаргетинга изображений более точной. Хотя сроки коммерциализации новой технологии еще не раскрыты, они подчеркнули необходимость дальнейших исследований для разработки моделей, которые полностью автоматизируют выбор лучшей технологии и ретаргетинг изображений. Кроме того, они планируют расширить набор данных, добавив больше выборок и методов перенаправления, чтобы повысить точность и адаптируемость модели.
Это исследование предлагает новые решения в области обработки изображений, и мы надеемся достичь более эффективного и интеллектуального перенаправления изображений в будущем.
Документ: https://ieeexplore.ieee.org/document/10776979.
Выделять:
Исследовательская группа разработала технологию автоматического перенаправления изображений, основанную на глубоком обучении, которая может легко адаптироваться к различным экранам.
Такие модели, как Resnet18, DenseNet121 и InceptionV3, используются для значительного повышения точности обработки изображений.
Расширяя набор данных и продолжая исследования, команда надеется создать более комплексное решение для автоматизированной обработки изображений.
Этот результат исследования дает новую идею решения проблемы адаптации изображений, а его высокая точность и автоматизация открывают новые возможности для развития будущих технологий обработки изображений. Последующие усилия исследовательской группы, особенно расширение набора данных и улучшение модели, еще больше повысят практичность и популярность технологии.