Die von der Carnegie Mellon University und dem Max-Planck-Institut für Intelligente Systeme gemeinsam entwickelte WHAM-Methode hat einen großen Durchbruch auf dem Gebiet der 3D-Bewegungsschätzung von Menschen erzielt. Diese Methode nutzt Deep-Learning-Technologie, um die menschliche Haltung und Form aus monokularen Videos genau zu rekonstruieren. Durch ein cleveres Algorithmus-Design wird die Auswirkung des Fußrutschens effektiv reduziert und eine hochpräzise und effiziente 3D-Erfassung menschlicher Bewegungen erreicht. Diese Technologie schnitt in Feldtests gut ab, übertraf viele bestehende fortschrittliche Methoden und eröffnete der Motion-Capture-Technologie neue Möglichkeiten.
Die von der Carnegie Mellon University und dem Max-Planck-Institut für Intelligente Systeme gemeinsam eingeführte WHAM-Methode hat einen Durchbruch bei der genauen Schätzung menschlicher 3D-Bewegungen aus Videos hinsichtlich Genauigkeit und Effizienz erzielt. Diese Methode kombiniert menschliche 3D-Bewegung und Videohintergrund und nutzt Deep-Learning-Technologie, um die menschliche Haltung und Form aus Einzelaugenvideos genau zu rekonstruieren. WHAM mit globaler Koordinatenkonsistenz erzielt hervorragende Ergebnisse, indem es das Verrutschen des Fußes durch Bewegungskontext und Fuß-Boden-Kontaktinformationen minimiert. In Feldtests schnitt WHAM bei mehreren Indikatoren hervorragend ab und ist derzeit eine der fortschrittlichsten Methoden.
Das Aufkommen der WHAM-Methode markiert einen bedeutenden Fortschritt in der 3D-Technologie zur Schätzung menschlicher Bewegungen. Ihre hohe Genauigkeit und Effizienz bieten starke technische Unterstützung für die virtuelle Realität, die Animationsproduktion, die Sportanalyse und andere Bereiche Zukunftsanwendung zur Förderung der kontinuierlichen Weiterentwicklung und des Fortschritts verwandter Technologien.