LangSplat, un modèle gaussien de langage 3D innovant développé conjointement par l'Université Tsinghua et l'Université Harvard, a réalisé une percée significative dans le domaine de la recherche de langage spatial 3D. Il effectue des recherches en langage ouvert de manière efficace et précise, 199 fois plus rapidement que les méthodes LERF existantes. Le modèle apprend les caractéristiques grâce à la visualisation, capture avec précision les limites des objets et peut identifier plus précisément diverses parties et ingrédients des objets, tels que les différents ingrédients d'un bol de ramen. Ses résultats de tests sur l'ensemble de données LERF et l'ensemble de données 3D OVS prouvent ses performances supérieures.
LangSplat est un modèle gaussien linguistique 3D innovant développé par des chercheurs de l'Université Tsinghua et de l'Université Harvard. Le modèle permet une recherche efficace et précise en langage ouvert dans l’espace 3D, 199 fois plus rapide que la méthode LERF précédente. Les chercheurs ont appris les caractéristiques grâce à la visualisation et ont réussi à capturer les limites des objets tout en démontrant une plus grande précision lors des tests. Non seulement LangSplat est rapide, mais il peut également étiqueter avec plus de précision les parties et les ingrédients des objets, tels que les différents ingrédients d'un bol de soupe ramen. Lors des tests, LangSplat a démontré une vitesse et une précision supérieures à la fois sur l'ensemble de données LERF et sur l'ensemble de données 3D OVS, apportant de nouvelles avancées dans le domaine de la recherche de langage 3D.
L'émergence de LangSplat a apporté de nouvelles possibilités à la technologie de recherche de langage 3D. Son efficacité et sa précision devraient être appliquées dans de nombreux domaines et favoriser le développement et le progrès des technologies connexes.