La startup norvégienne 1X Technologies a réalisé des progrès révolutionnaires dans le développement de modèles mondiaux d’intelligence artificielle pour les robots. Le modèle qu'ils ont créé agit comme un terrain d'entraînement virtuel pour les robots, leur permettant d'être testés et améliorés de manière sûre et efficace sans avoir besoin de tests longs et coûteux dans le monde réel, ce qui est essentiel pour résoudre les problèmes de fiabilité de longue date en robotique. . Cette technologie peut améliorer considérablement l’adaptabilité des robots dans des environnements dynamiques complexes et apporter un soutien solide au développement de robots à usage général.
La startup norvégienne 1X Technologies a récemment annoncé avoir réalisé des progrès significatifs dans le développement de modèles du monde basés sur l'intelligence artificielle pour les robots. En termes simples, ces modèles sont comme des terrains d'essai virtuels pour les robots, permettant de tester et d'améliorer les machines dans divers scénarios sans avoir besoin de tests réels sur le terrain.
1X pense que c’est la clé pour résoudre « l’énigme des robots », à savoir comment évaluer de manière fiable les robots formés à de multiples tâches dans un environnement changeant. Prenez par exemple un robot capable de plier des T-shirts. Ses performances variaient sur 50 jours et le sentiment d'accomplissement était souvent éphémère.
1X affirme que même le même modèle de robot peut connaître d'énormes fluctuations de performances lorsque l'environnement change, ce qui rend extrêmement difficile une évaluation rigoureuse dans le monde réel.
Pour former son modèle mondial, 1X a collecté des milliers d'heures de séquences vidéo de son robot humanoïde EVE effectuant diverses tâches dans les maisons et les bureaux. Grâce à l’apprentissage automatique, les modèles sont désormais capables de prédire raisonnablement comment les objets et l’environnement réagiront aux actions des robots. Le modèle peut produire un résultat visuel crédible même pour des comportements qui ne sont pas explicitement programmés, comme apprendre à éviter tout contact avec des personnes et des objets.
Actuellement, les modèles 1X sont capables de gérer des interactions physiques complexes, telles que saisir et soulever des objets, ouvrir des portes et des tiroirs et manipuler des matériaux déformables comme des vêtements et même plier des T-shirts.
La valeur fondamentale de leur modèle mondial est de simuler l’interaction des objets. Par exemple, dans les prochaines générations, les modèles bénéficieront du même écran initial et de trois ensembles d’actions différents pour saisir les boîtes. Dans chaque cas, la caisse saisie est soulevée et déplacée au gré des mouvements du robot, tandis que les autres caisses restent en place.
Néanmoins, 1X reconnaît certaines limitations. Par exemple, les modèles ont parfois du mal à conserver la cohérence de la couleur et de la forme des objets ou à simuler avec précision des phénomènes physiques. La capacité de se reconnaître dans un miroir reste également peu fiable.
Malgré les défis, 1X considère ces modèles mondiaux comme une étape importante dans le développement et la formation de robots universels. Pour accélérer les progrès, la société propose également des ensembles de données, des modèles pré-entraînés et des prix en argent dans le cadre du 1X World Model Challenge.
L'objectif à long terme de 1X est d'utiliser directement le modèle mondial pour la formation des robots, ce qui apportera d'énormes améliorations d'efficacité par rapport aux tests réels. Pour atteindre cet objectif, ils recrutent activement des experts dans le domaine de l’intelligence artificielle. Plus tôt cette année, 1X a également réussi à lever 100 millions de dollars pour promouvoir le lancement sur le marché de son robot humanoïde domestique Neo. Ce financement a reçu le soutien de leaders de l'industrie comme OpenAI, démontrant pleinement son haut niveau d'engagement envers la technologie 1X.
En plus du 1X, Nvidia investit également massivement dans les robots humanoïdes. La société a récemment lancé une méthode de formation utilisant Vision Pro d'Apple, et le chercheur de Nvidia, Jim Fan, estime que la robotique connaîtra un « moment GPT-3 » dans les prochaines années.
La technologie modèle mondiale de 1X Technologies ouvre la voie au développement futur de la robotique. Même si des défis subsistent, son potentiel est énorme et devrait révolutionner la façon dont les robots sont formés et utilisés à l'avenir. Cette technologie améliorera non seulement considérablement l'efficacité, mais favorisera également les progrès rapides de la technologie robotique et apportera plus de possibilités à la société humaine.