Mit dem Aufkommen des Multi-Device-Zeitalters ist die plattformübergreifende Anpassung von Bildern und Videos zu einem dringenden Bedarf geworden. Wie man die Bildgröße automatisch und effizient an unterschiedliche Bildschirmgrößen anpasst und den besten Anzeigeeffekt beibehält, ist zu einem Forschungsschwerpunkt im Bereich der Bildverarbeitung geworden. Ein Forschungsteam der Universität Sharjah in den Vereinigten Arabischen Emiraten hat eine innovative, auf Deep Learning basierende Lösung bereitgestellt, die automatisch die optimale Größe von Bildern vorhersagen und die am besten geeignete Umleitungstechnologie auswählen kann, wodurch Informationsverluste effektiv reduziert und die Benutzererfahrung verbessert werden.
Mit der rasanten Popularität digitaler Geräte ist die perfekte Anpassung von Bildern und Videos an verschiedene Bildschirmgrößen zu einem dringend zu lösenden Problem geworden. Ein Forschungsteam der Universität Sharjah in den Vereinigten Arabischen Emiraten hat kürzlich eine Studie veröffentlicht, die ein Deep-Learning-Modell verwendet, um eine neue Technologie zu entwickeln, die automatisch die optimale Größe von Bildern vorhersagen kann, um eine nahtlose Anzeige zwischen verschiedenen Geräten zu erreichen.
Der Kern dieser Forschung ist der Einsatz von Transfer-Learning-Technologie unter Verwendung von Deep-Learning-Modellen wie Resnet18, DenseNet121 und InceptionV3. Forscher sagten, dass es zwar viele Bild-Retargeting-Technologien gibt, diese die Bildgröße jedoch häufig nicht automatisch anpassen können und dennoch manuelle Eingriffe erfordern. Dies führt dazu, dass Bilder auf verschiedenen Bildschirmen möglicherweise beschnitten oder verzerrt erscheinen. Daher hofft das Forschungsteam, durch automatisierte Mittel die beste Bildumleitungsmethode zu finden, um Informationsverluste zu reduzieren und die Bildqualität aufrechtzuerhalten.
Um dieses Ziel zu erreichen, erstellten die Forscher einen Datensatz mit 46.716 Bildern unterschiedlicher Auflösung und nutzten sechs Kategorien von Retargeting-Techniken. Durch Experimente nutzten sie Kategorieinformationen als dritte Eingabe und kodierten Auflösungsinformationen als zusätzlichen Kanal des Bildes. Nach der Auswertung zeigen die Ergebnisse, dass ihre Methode bei der Auswahl geeigneter Umleitungstechniken die beste F1-Bewertung von 90 % erreicht, was auf die Wirksamkeit dieser Methode hinweist.
Das Forschungsteam ist davon überzeugt, dass Deep Learning Bildmerkmale automatisch extrahieren und komplexe Beziehungen effektiv erfassen kann, wodurch die Klassifizierung von Bild-Retargeting-Methoden genauer wird. Während ein Zeitplan für die Kommerzialisierung der neuen Technologie noch nicht bekannt gegeben wurde, betonten sie die Notwendigkeit weiterer Forschung zur Entwicklung von Modellen, die die Auswahl der besten Technologie und das Retargeting von Bildern vollständig automatisieren. Darüber hinaus planen sie, den Datensatz zu erweitern und weitere Stichproben und Umleitungsmethoden hinzuzufügen, um die Genauigkeit und Anpassungsfähigkeit des Modells zu verbessern.
Diese Forschung liefert neue Lösungen für den Bereich der Bildverarbeitung und wir freuen uns darauf, in Zukunft eine effizientere und intelligentere Bildumleitung zu erreichen.
Papier: https://ieeexplore.ieee.org/document/10776979
Highlight:
Das Forschungsteam entwickelte eine auf Deep Learning basierende automatische Bildumleitungstechnologie, die sich nahtlos an verschiedene Bildschirme anpassen lässt.
Modelle wie Resnet18, DenseNet121 und InceptionV3 werden verwendet, um die Genauigkeit der Bildverarbeitung deutlich zu verbessern.
Durch die Erweiterung des Datensatzes und weitere Forschung hofft das Team, eine umfassendere automatisierte Bildverarbeitungslösung zu erreichen.
Dieses Forschungsergebnis liefert eine neue Idee zur Lösung des Bildanpassungsproblems und seine hohe Genauigkeit und Automatisierung eröffnen neue Möglichkeiten für die Entwicklung zukünftiger Bildverarbeitungstechnologie. Die weiteren Bemühungen des Forschungsteams, insbesondere die Erweiterung des Datensatzes und die Verbesserung des Modells, werden die Praktikabilität und Popularität der Technologie weiter steigern.