Редактор Downcodes узнал, что Google использует свой Gemini AI для улучшения навигации роботов и возможностей выполнения задач. Последние исследования команды DeepMind показывают, что функция длинного контекстного окна Gemini 1.5 Pro значительно улучшает взаимодействие на естественном языке между пользователями и роботом RT-2. Этот технологический прорыв позволяет роботам понимать окружающую среду, просматривая видео, и выполнять сложные задачи, например, направлять пользователей к розеткам для зарядки в соответствии с инструкциями, демонстрируя огромный потенциал искусственного интеллекта в области робототехники.
Google обучает своих роботов с помощью Gemini AI, чтобы улучшить навигацию и выполнение задач.
В новой исследовательской работе команда DeepMind Robotics подробно объясняет, как использовать длинное контекстное окно Gemini1.5Pro, чтобы пользователям было проще взаимодействовать с роботом RT-2, используя инструкции на естественном языке. Совершив видеотур по определенной области, исследователи использовали Gemini1.5Pro, чтобы позволить роботу «смотреть» видео, чтобы понять окружающую среду, позволяя роботу выполнять команды на основе того, что он наблюдал, например, направлять пользователя к источнику питания. розетка для зарядки.
DeepMind сообщила, что робот, оснащенный Gemini, успешно выполнил более 50 пользовательских инструкций на рабочей площади более 9000 квадратных футов с вероятностью успеха 90%.
Кроме того, исследователи также обнаружили, что Gemini1.5Pro позволяет роботу планировать выполнение инструкций, а не только навигацию. Например, когда пользователь, у которого на столе много банок колы, спрашивает робота, доступен ли его любимый напиток, Gemini сообщает роботу, что ему следует отправиться к холодильнику, чтобы проверить, а затем сообщает результаты пользователю. DeepMind заявила, что проведет дальнейшее расследование этих результатов.
Хотя видеодемонстрация, предоставленная Google, впечатляет, согласно исследованию, роботу требуется 10–30 секунд для обработки этих инструкций. Хотя может пройти некоторое время, прежде чем мы поделимся своими домами с более продвинутыми роботами, картографирующими окружающую среду, по крайней мере, эти роботы смогут помочь нам найти потерянные ключи или кошелек.
Выделять:
Gemini AI обучает роботов улучшению навигации и возможностей выполнения задач
? Gemini1.5Pro позволяет роботам выполнять инструкции на естественном языке
Исследование показало, что Gemini позволяет роботам планировать и выполнять инструкции, выходящие за рамки навигации
Этот результат исследования предвещает быстрое развитие робототехники в будущем. Применение искусственного интеллекта Gemini значительно повысит уровень интеллекта роботов и позволит им лучше служить человеческой жизни. Хотя некоторые технические проблемы все еще существуют, я верю, что в ближайшем будущем более совершенные роботы войдут в нашу жизнь и принесут нам больше удобства. Редактор Downcodes продолжит уделять внимание последним разработкам в этой области.