Недавно обнимая лицо и физический интеллект, совместно запустил «PI0» (Pi-Re-Re-rece), первую базовую модель, которая непосредственно преобразовала команды естественного языка в физические действия. Этот инновационный запуск привлек широкое внимание, и Реми Каден, главный ученый из Hearging Face, объявил в социальных сетях, что «PI0 - самая продвинутая модель действий визуального языка, которая может превратить команды естественного языка в автономное поведение».
Запуск «PI0» знаменует собой значительное изменение в области робототехники, аналогично влиянию CHATGPT в области генерации текста. Первоначально разработанный физическим интеллектом и теперь доступным на платформе Lerobot, модель Hugging Face, способна выполнять сложные задачи, такие как складывание одежды, упаковка столовых столов и упаковочные продукты, навыки, которые трудно освоить традиционных роботов.
«Текущие роботы, как правило, являются узкодоменными экспертами, сосредотачивающимися на повторяющихся действиях, в то время как введение« PI0 »позволяет роботам изучать и выполнять задачи с помощью инструкций пользователей, а сложность программирования сводится к простому голосу. Инструкция».
Ядро технологии "PI0" является важным технологическим прорывом. Модель обучает данные из семи различных платформ-роботов и 68 уникальных задач, что позволяет ей выполнять задачи, начиная от тонких операций до сложных многоэтапных процедур. В то же время, новая технология соответствующей потока используется, чтобы позволить ей производить гладкие, траектории действий в реальном времени в 50 раз в секунду, тем самым достигая высокой точности и адаптивности в реальных приложениях.
Исходя из этого, команда разработчиков также запустила версию «PI0 -FAST», которая объединяет новую схему маркировки - маркер действия частоты пространства (FAST), который увеличивает скорость обучения в пять раз, и способность обобщения также была улучшена Между различными средами и типами роботов.
Внедрение этой технологии окажет глубокое влияние на отрасль. Производители могут перепрограммировать роботов с простыми голосовыми командами, в то время как склады могут развернуть более гибкие системы автоматизации по мере необходимости. Малый бизнес также будет легче получить доступ к робототехнике, снижая барьеры для программирования и развертывания.
Однако, несмотря на значительный прогресс «PI0», все еще есть некоторые проблемы. Эта модель иногда может столкнуться с трудностями при работе с очень сложными задачами и требует значительных вычислительных ресурсов. Кроме того, проблемы с надежностью и безопасностью в промышленных средах все еще требуют внимания.
Запуск "PI0" происходит в критический период быстрого развития индустрии искусственного интеллекта, и он представляет собой первую успешную попытку между языковыми моделями и физическим миром. По мере того, как технологии продолжают развиваться, роботы в будущем станут более разговорными, адаптируемыми и простыми в доступе, способствуя широко распространенному использованию роботов в таких областях, как дома, больницы и малый бизнес.
PI0: https://huggingface.co/lerobot/pi0
Ключевые моменты:
PI0 - первая модель робота, которая преобразует команды естественного языка в физические действия, изменяя традиционный метод программирования.
Эта модель была обучена многоплатформенными и многозадачными задачами и может выполнять сложные ежедневные операции и снизить порог для использования робота.
Версия PI0-Fast улучшает скорость обучения и возможности обобщения и, как ожидается, ускорит продвижение промышленной автоматизации.
С запуском технологии "PI0", область роботов вступила в новые изменения и будет более умной и удобной в будущем.