Das norwegische Startup 1X Technologies hat bahnbrechende Fortschritte bei der Entwicklung von Weltmodellen mit künstlicher Intelligenz für Roboter erzielt. Das von ihnen erstellte Modell fungiert als virtuelles Übungsgelände für die Roboter und ermöglicht es, sie sicher und effizient zu testen und zu verbessern, ohne dass zeitaufwändige und teure Tests in der Praxis erforderlich sind, was für die Lösung langjähriger Zuverlässigkeitsprobleme in der Robotik von entscheidender Bedeutung ist . Diese Technologie kann die Anpassungsfähigkeit von Robotern in komplexen dynamischen Umgebungen erheblich verbessern und die Entwicklung von Allzweckrobotern stark unterstützen.
Das norwegische Startup 1X Technologies gab kürzlich bekannt, dass es erhebliche Fortschritte bei der Entwicklung von auf künstlicher Intelligenz basierenden Modellen der Welt für Roboter erzielt hat. Einfach ausgedrückt sind diese Modelle wie virtuelle Testgelände für Roboter, auf denen Maschinen in verschiedenen Szenarien getestet und verbessert werden können, ohne dass reale Feldtests erforderlich sind.
1X glaubt, dass dies der Schlüssel zur Lösung des „Roboter-Rätsels“ ist – nämlich wie man Roboter, die für mehrere Aufgaben in einer sich verändernden Umgebung ausgebildet sind, zuverlässig bewerten kann. Nehmen wir zum Beispiel einen Roboter, der T-Shirts falten kann. Seine Leistung schwankte über 50 Tage, und das Erfolgserlebnis war oft flüchtig.
1X sagt, dass sogar das gleiche Robotermodell große Leistungsschwankungen erfahren kann, wenn sich die Umgebung ändert, was eine strenge Bewertung in der Praxis äußerst schwierig macht.
Um sein Weltmodell zu trainieren, sammelte 1X Tausende Stunden Videomaterial von seinem humanoiden Roboter EVE, der verschiedene Aufgaben in Häusern und Büros ausführt. Durch maschinelles Lernen sind Modelle nun in der Lage, vernünftig vorherzusagen, wie Objekte und die Umgebung auf Roboteraktionen reagieren werden. Das Modell kann auch für Verhaltensweisen, die nicht explizit programmiert sind, eine glaubwürdige visuelle Ausgabe erzeugen, beispielsweise das Erlernen, den Kontakt mit Menschen und Objekten zu vermeiden.
Derzeit sind 1X-Modelle in der Lage, komplexe physikalische Interaktionen zu bewältigen, wie etwa das Greifen und Heben von Gegenständen, das Öffnen von Türen und Schubladen sowie den Umgang mit verformbaren Materialien wie Kleidung und sogar dem Falten von T-Shirts.
Der Kernwert ihres Weltmodells besteht darin, die Interaktion von Objekten zu simulieren. Beispielsweise werden die Modelle in den nächsten Generationen denselben Startbildschirm und drei verschiedene Aktionssätze zum Greifen von Kisten erhalten. Dabei wird jeweils die ergriffene Kiste mit den Bewegungen des Roboters angehoben und bewegt, während die anderen Kisten an Ort und Stelle bleiben.
Dennoch erkennt 1X einige Einschränkungen an. Modelle haben beispielsweise manchmal Probleme, die Farbe und Form von Objekten konsistent zu halten oder physikalische Phänomene genau zu simulieren. Auch die Fähigkeit, sich selbst im Spiegel zu erkennen, bleibt unzuverlässig.
Trotz der Herausforderungen sieht 1X diese Weltmodelle als Meilenstein in der Entwicklung und Ausbildung universeller Roboter. Um den Fortschritt zu beschleunigen, bietet das Unternehmen im Rahmen der 1X World Model Challenge auch Datensätze, vorab trainierte Modelle und Preisgelder an.
Das langfristige Ziel von 1X besteht darin, das Weltmodell direkt für das Robotertraining zu nutzen, was im Vergleich zu realen Tests enorme Effizienzsteigerungen bringen wird. Um dieses Ziel zu erreichen, rekrutieren sie aktiv Experten auf dem Gebiet der künstlichen Intelligenz. Anfang des Jahres hat 1X außerdem erfolgreich 100 Millionen US-Dollar an Finanzmitteln eingeworben, um die Markteinführung seines humanoiden Heimroboters Neo zu fördern. Diese Finanzierung wurde von Branchenführern wie OpenAI unterstützt, was sein hohes Engagement für die 1X-Technologie voll und ganz unter Beweis stellt.
Neben 1X investiert Nvidia auch stark in humanoide Roboter. Das Unternehmen hat kürzlich eine Trainingsmethode mit Apples Vision Pro auf den Markt gebracht, und Nvidia-Forscher Jim Fan glaubt, dass die Robotik in den nächsten Jahren einen „GPT-3-Moment“ erleben wird.
Die Weltmodelltechnologie von 1X Technologies weist den Weg für die zukünftige Entwicklung der Robotik. Obwohl es noch Herausforderungen gibt, ist ihr Potenzial enorm und wird voraussichtlich die Art und Weise, wie Roboter in Zukunft trainiert und eingesetzt werden, revolutionieren. Diese Technologie wird nicht nur die Effizienz erheblich verbessern, sondern auch den schnellen Fortschritt der Robotertechnologie fördern und der menschlichen Gesellschaft mehr Möglichkeiten eröffnen.