Die Forschung über das Ausmaß der Daten im Bereich der Manipulation von Roboter war schon immer eine große Herausforderung im Bereich des Roboterlernens. Die vorhandene Forschung konzentriert sich auf die Bereiche der Verarbeitung natürlicher Sprache und des Computervisions, während die Forschung auf dem Gebiet der Robotermanipulation relativ knapp ist. In diesem Artikel werden die neuesten Forschungsergebnisse des Forschungsteams der Tsinghua -Universität eingeführt.
Die schnelle Entwicklung des Deep-Lernens ist untrennbar mit groß angelegten Datensätzen, Modellen und Rechenvolumen verbunden. In den Bereichen natürlicher Sprachverarbeitung und Computer Vision haben Forscher eine Machtverhältnis zwischen Modellleistung und Datenskala entdeckt. Das Gebiet der Roboter, insbesondere der Robotermanipulation, hat jedoch noch keine ähnlichen Maßnahmen ermittelt.
Ein Forschungsteam an der Tsinghua University hat kürzlich ein Papier veröffentlicht, in dem das Ausmaß der Daten im Roboter -Nachahmung gelernt wurde, und eine effiziente Datenerfassungsstrategie vorgeschlagen hat Umgebungen und neue Objekte.
Die Forscher unterteilten die Verallgemeinerungsfunktionen in zwei Dimensionen: Umweltverallgemeinerung und Objektverallgemeinerung und verwendeten Handbacken, um menschliche Demonstrationsdaten in verschiedenen Umgebungen und unterschiedlichen Objekten zu sammeln, und modellierten diese Daten mithilfe von Diffusionsstrategien. Die Forscher konzentrierten sich zunächst auf die beiden Aufgaben des Gießens von Wasser und Maus.
Die Forschungsergebnisse zeigen, dass:
Die Verallgemeinerungsfähigkeit der Strategie für ein neues Objekt, eine neue Umgebung oder beides betrifft Power-Schwiegereltern in Bezug auf die Anzahl der Schulungsobjekte, Trainingsumgebungen oder Trainingsumgebungs-Objektpaare.
Die Erhöhung der Vielfalt von Umgebungen und Objekten ist effektiver als die Anzahl der Demonstrationen für jede Umgebung oder jedes Objekt zu erhöhen.
Sammeln Sie Daten in so vielen Umgebungen wie möglich (z. B. 32 Umgebungen), mit einem einzigartigen Betriebsobjekt und 50 Demonstrationen in jeder Umgebung können Sie eine Strategie mit einer starken Verallgemeinerungsfähigkeit (90% Erfolgsrate) ausbilden, um sie neu zu erfüllen Umgebungen und neue Objekte.
Basierend auf diesen Datenskala -Gesetzen haben Forscher eine effiziente Datenerfassungsstrategie vorgeschlagen. Sie empfehlen, Daten in so vielen verschiedenen Umgebungen wie möglich zu sammeln und in jeder Umgebung nur ein eindeutiges Objekt zu verwenden. Wenn die Gesamtzahl der Umgebungs-Objektpaare 32 erreicht, reicht es normalerweise aus, eine Strategie zu schulen, die in einer neuen Umgebung arbeiten und mit Objekten interagiert, die zuvor noch nicht gesehen wurden. Für jedes Umgebungs-Objekt-Paar werden 50 Demos empfohlen, um zu sammeln.
Um die universelle Anwendbarkeit der Datenerfassungsstrategie zu überprüfen, wendeten die Forscher sie auf zwei neue Aufgaben an: das Handtuch falten und das Ladegerät ziehen. Die Ergebnisse zeigen, dass diese Strategie auch Strategien mit starken Generalisierungsfähigkeiten für diese beiden neuen Aufgaben schulen kann.
Die Studie zeigt, dass eine Single-Task-Strategie, die in jeder Umgebung und einem Objekt eingesetzt werden kann, indem relativ bescheidene Zeit und Ressourcen investiert werden können. Um diesbezüglich die Bemühungen der Forscher weiter zu unterstützen, veröffentlichte das Tsinghua-Team ihre Code, Daten und Modelle, in der Hoffnung, weitere Forschung auf diesem Gebiet zu inspirieren und letztendlich einen universellen Roboter zu implementieren, der komplexe Probleme mit offener Welt lösen kann.
Papieradresse: https://arxiv.org/pdf/2410.18647
Diese Studie bietet wichtige theoretische Leitlinien und praktische Methoden zum Nachahmung von Roboter und bildet eine solide Grundlage für den Aufbau eines allgemeineren Roboter -intelligenten Systems. Die Open Source dieses Forschungsergebnisses bietet auch wertvolle Ressourcen für andere Forscher, um die Entwicklung des Feldes zu fördern.