Исследовательская группа MIT недавно провела большой прорыв для разработки совершенно новой модели обучения роботов, которая заимствует методы обучения крупных языковых моделей (LLMS) и больше не опирается на конкретные наборы данных, но используется массовая информация для обучения. Ожидается, что это инновация решит ограничения, с которыми сталкиваются традиционные методы обучения роботов при реагировании на изменения окружающей среды и новые проблемы, закладывая прочную основу для исследования и разработки общих роботизированных мозгов. Значение этого исследования заключается в том, что оно может изменить будущее робототехники, позволяя роботам лучше адаптироваться к сложной и изменчивой среде и выполнять более широкий диапазон задач.
MIT на этой неделе представила совершенно новую модель обучения роботов, которая отказалась от предыдущих методов обучения, которая была сосредоточена на конкретных наборах данных и вместо этого использовала огромные объемы информации, используемой при обучении на крупных языковых моделях (LLMS).
Исследователи отмечают, что имитационное обучение, то есть агенты учатся, имитируя людей, выполняющих задачи, - может терпеть неудачу, сталкиваясь с небольшими проблемами. Эти проблемы могут включать в себя различные условия освещения, различные условия окружающей среды или новые препятствия. В этих случаях у робота не хватает данных, чтобы адаптироваться к этим изменениям.
Команда позаимствовала модели, такие как GPT-4, и приняла грубый метод решения задач, управляемый данными.
«В области языка данные - это предложения», - сказал Лируи Ван, ведущий автор газеты. «В области робототехники, учитывая разнообразие данных, если вы хотите предварительно тренироваться аналогичным образом, нам нужны разные архитектуры».
Команда представила новую архитектуру, называемую гетерогенным предварительно обученным трансформатором (HPT), которая интегрирует информацию из разных датчиков и разных сред. Затем данные интегрируются в учебную модель с использованием трансформатора. Чем больше преобразователь, тем лучше результат выходного выхода.
Затем пользователь входит в дизайн, конфигурацию робота и задачи, которые они хотят выполнить.
«Наша мечта - иметь универсальный роботизированный мозг, который вы можете скачать и использовать для своего робота без каких -либо тренировок», - сказал Дэвид Хельд, доцент Университета Карнеги -Меллона. «Хотя мы только начинаем, мы будем продолжать усердно работать, надеясь, что масштаб может привести к прорывам в роботизированных стратегиях, таких как модели крупных языков».
Это исследование было частично профинансировано Институтом Toyota. В прошлом году в TechCrunch Disrupt, TRI продемонстрировал способ обучения робота на ночь. Недавно он достиг партнерства в водосборном бассейне, которое сочетает в себе исследование роботизированного обучения с оборудованием Boston Dynamics.
Это исследование, проведенное MIT, принесло новые возможности для области робототехники, и его будущее развитие стоит с нетерпением ждать. Ожидается, что модель, опираясь на успешный опыт крупных языковых моделей, будет способствовать более значительным достижениям в области роботизированных технологий, в конечном итоге реализуя мечту об общем роботизированном мозге, чтобы роботы могли служить людям более гибко и разумно.