Исследования по масштабам данных в области манипуляции с роботами всегда были серьезной проблемой в области обучения роботам. Существующие исследования фокусируются на областях обработки естественного языка и компьютерного зрения, в то время как исследования на области манипуляции с роботами относительно скудны. В этой статье представлены последние результаты исследования исследовательской группы Университета Цинхуа.
Быстрое развитие глубокого обучения неотделимо от крупномасштабных наборов данных, моделей и вычислительного объема. В областях обработки естественного языка и компьютерного зрения исследователи обнаружили взаимосвязь с составлением составления между производительностью модели и шкалой данных. Тем не менее, область роботов, особенно манипуляции с роботами, еще не установила аналогичные законы масштаба.
Исследовательская группа в Университете Цинхуа недавно опубликовала статью, в которой изучалось масштаб данных в обучении имитации роботов и предложила эффективную стратегию сбора данных, которая собрала достаточно данных всего за один день, чтобы сделать стратегию способность достичь успеха около 90% на новом среды и новые объекты.
Исследователи разделили возможности обобщения на два измерения: обобщение окружающей среды и обобщение объектов, а также использовали ручные челюсти для сбора человеческих демонстрационных данных в различных средах и различных объектах, а также смоделировали эти данные с использованием стратегий диффузии. Исследователи сначала сосредоточились на двух задачах по размещению воды и мыши.
Результаты исследования показывают, что:
Способность обобщения стратегии для нового объекта, новая среда или оба-это власть, связанная с количеством объектов обучения, обучающей среды или пары обучающей среды, соответственно.
Увеличение разнообразия сред и объектов является более эффективным, чем увеличение числа демонстраций для каждой среды или объекта.
Соберите данные в как можно более многих средах (например, 32 среда), с уникальным операционным объектом и 50 демонстрациями в каждой среде, вы можете обучить стратегию с сильной способностью обобщения (90% успех), чтобы он мог работать на новой среды и новые объекты.
Основываясь на этих законах по масштабе данных, исследователи предложили эффективную стратегию сбора данных. Они рекомендуют собирать данные в как можно больше различных сред, используя только один уникальный объект в каждой среде. Когда общее количество пар в окружающей среде достигает 32, обычно достаточно для обучения стратегии, которая может работать в новой среде и взаимодействовать с объектами, которые не видели ранее. Для каждой пары-объекта окружающей среды рекомендуется собирать 50 демонстраций.
Чтобы проверить универсальную применимость стратегии сбора данных, исследователи применили ее к двум новым задачам: складывая полотенце и отключение зарядного устройства. Результаты показывают, что эта стратегия также может обучать стратегии с сильными возможностями обобщения на этих двух новых задачах.
Исследование показывает, что стратегия с одной задачей может быть развернута в любой среде и объекте, инвестируя относительно скромное время и ресурсы. Для дальнейшей поддержки усилий исследователей в этом отношении команда Tsinghua выпустила свой код, данные и модели, надеясь вдохновить дальнейшие исследования в этой области и в конечном итоге внедрить универсальный робот, который может решить сложные проблемы с открытым миром.
Бумажный адрес: https://arxiv.org/pdf/2410.18647
Это исследование предоставляет важные теоретические руководства и практические методы для обучения имитации роботов и закладывает прочную основу для создания более обобщенной интеллектуальной системы робота. Открытый источник этого результата исследования также предоставляет ценные ресурсы для других исследователей для продвижения развития этой области.