Le modèle QUEEN AI développé conjointement par NVIDIA et l'Université du Maryland a apporté des avancées révolutionnaires dans les domaines de la réalité virtuelle et du streaming multimédia. Ce modèle peut réaliser un changement de perspective libre dans des scènes telles que des événements sportifs, tout en compressant chaque image de scènes 3D à un très petit 0,7 Mo et en maintenant une vitesse de rendu étonnante de 350 images par seconde, ce qui est difficile à atteindre avec les technologies précédentes. Ces progrès révolutionnaires sont dus à l'algorithme unique de QUEEN, qui peut identifier et traiter intelligemment les parties changeantes de la scène et améliorer l'efficacité informatique, obtenant ainsi un équilibre parfait entre le taux de compression, la qualité visuelle, le temps d'encodage et la vitesse de rendu.
Dans le domaine de la réalité virtuelle et du streaming multimédia, NVIDIA et l'Université du Maryland ont réalisé une avancée décisive. Ce modèle d'IA nommé QUEEN permet non seulement aux téléspectateurs de changer d'angle de vue à volonté pendant les événements sportifs, mais compresse également chaque image de la scène 3D à seulement 0,7 Mo tout en conservant une vitesse de rendu étonnante de 350 images par seconde.
La clé de cette technologie réside dans sa méthode de traitement unique. La reconstruction de scènes 3D traditionnelle est souvent confrontée au dilemme d'un espace de stockage excessif ou d'une mauvaise qualité d'image, et QUEEN résout intelligemment ce problème. Il utilise des algorithmes intelligents pour se concentrer sur la capture des parties changeantes de l'image et réutilise les éléments de la scène qui restent statiques, améliorant ainsi considérablement l'efficacité informatique.
Shalini de Mello, responsable de la recherche chez NVIDIA, a parlé des principaux avantages de QUEEN : "Nous avons créé une solution qui équilibre parfaitement le taux de compression, la qualité visuelle, le temps d'encodage et la vitesse de rendu." Cet équilibre permet un point de vue libre en temps quasi réel. La transmission vidéo est possible.
Au niveau technique, QUEEN adopte un cadre innovant de splash gaussien 3D pour obtenir une reconstruction de haute qualité en apprenant les résidus d'attributs gaussiens entre des images consécutives. L’équipe de recherche a également développé un cadre clairsemé quantifié, qui combine un décodeur latent spécialisé et des modules de déclenchement pour optimiser davantage l’efficacité du stockage des données.
Les perspectives d'application de cette technologie sont passionnantes : les amateurs de sport peuvent choisir librement l'angle de vue pendant les matchs en direct, le public des concerts peut vivre une expérience de réalité virtuelle immersive et les apprenants peuvent également choisir celui qui leur convient le mieux pendant l'enseignement à distance pour acquérir des compétences. comme la cuisine ou l'artisanat. Dans le domaine industriel, il peut également aider à la gestion à distance des entrepôts.
Avec une vitesse de rendu aussi rapide et des effets visuels exceptionnels, QUEEN redéfinit l'avenir de l'expérience de streaming. Il ne s’agit pas seulement d’un progrès technologique, mais cela ouvre également une nouvelle ère pleine de possibilités pour les créateurs et les consommateurs de contenu numérique.
L'émergence du modèle QUEEN indique que la technologie du streaming multimédia est entrée dans une nouvelle étape de développement. Son potentiel d'application dans divers domaines est énorme et l'avenir mérite d'être attendu. Je pense que dans un avenir proche, nous pourrons profiter d’un contenu numérique plus fluide, plus réaliste et plus immersif.