최근 포옹 얼굴과 물리 지능은 공동으로 자연어 명령을 물리적 행동으로 직접 변환 한 최초의 기본 모델 인 "Pi0"(Pi-Zero)을 공동으로 시작했습니다. 이 혁신적인 출시는 광범위한 관심을 끌었으며, Hugging Face의 최고 연구 과학자 인 Remi Cadene은“PI0은 자연 언어 명령을 자율적 인 행동으로 바꿀 수있는 가장 진보 된 시각적 언어 행동 모델”이라고 소셜 미디어에 발표했다.
"PI0"의 출시는 텍스트 생성 분야에서 Chatgpt의 영향과 유사한 로봇 공학 분야의 주요 변화를 나타냅니다. 원래 Physical Intelligence에 의해 개발되었으며 현재 Hugging Face의 Lerobot 플랫폼에서 사용할 수있는이 모델은 접는 옷, 식당 포장 식탁 및 포장 식료품 포장, 전통적인 로봇이 마스터하기 어려운 기술과 같은 복잡한 작업을 수행 할 수 있습니다.
"현재 로봇은 반복적 인 행동에 중점을 둔 좁은 도메인 전문가 인 경향이있는 반면, 'PI0'을 도입하면 로봇은 사용자 지침을 통해 작업을 배우고 수행 할 수 있으며 프로그래밍의 복잡성은 간단한 음성으로 줄어 듭니다."
"PI0"기술의 핵심은 중요한 기술 혁신입니다. 이 모델은 7 개의 서로 다른 로봇 플랫폼과 68 개의 고유 한 작업의 데이터를 훈련시켜 고급 작업에서 복잡한 다중 단계 절차에 이르기까지 작업을 처리 할 수 있습니다. 동시에, 새로운 흐름 일치 기술은 초당 50 회 부드럽고 실시간 액션 궤적을 생성 할 수 있도록하여 실제 응용 분야에서 높은 정확도와 적응성을 달성 할 수 있습니다.
이를 바탕으로 개발 팀은 새로운 마킹 체계 - 주파수 공간 동작 시퀀스 마커 (FAST)를 결합한 "PI0 -FAST"버전을 출시하여 교육 속도를 5 배 증가시키고 일반화 능력도 개선되었습니다. 다른 환경과 로봇 유형 사이.
이 기술의 도입은 업계에 큰 영향을 미칠 것입니다. 제조업체는 간단한 음성 명령으로 로봇을 재 프로그래밍 할 수있는 반면 창고는 필요에 따라보다 유연한 자동화 시스템을 배포 할 수 있습니다. 소규모 기업은 로봇 공학에 액세스하기가 더 쉬워서 프로그래밍 및 배포에 대한 장벽을 낮출 것입니다.
그러나 "PI0"의 상당한 진보에도 불구하고 여전히 몇 가지 어려움이 있습니다. 이 모델은 때때로 매우 복잡한 작업을 처리 할 때 어려움을 겪을 수 있으며 상당한 컴퓨팅 리소스가 필요합니다. 또한 산업 환경의 신뢰성 및 안전 문제는 여전히주의가 필요합니다.
"PI0"의 출시는 인공 지능 산업의 빠른 발전의 중요한시기에 이루어지며 언어 모델과 물리적 세계 사이의 첫 번째 성공적인 시도를 나타냅니다. 기술이 계속 성숙함에 따라 미래의 로봇은 대화적이고 적응력이 뛰어나고 접근하기 쉬워 질 것입니다. 가정, 병원 및 소기업과 같은 분야에서 로봇의 광범위한 사용을 촉진 할 것입니다.
pi0 : https://huggingface.co/lerobot/pi0
핵심 사항 :
PI0은 자연어 명령을 물리적 행동으로 변환하여 기존 프로그래밍 방법을 변경하는 최초의 로봇 모델입니다.
이 모델은 멀티 플랫폼 및 멀티 태스크로 교육을 받았으며 복잡한 일일 작업을 수행하고 로봇 사용의 임계 값을 낮출 수 있습니다.
PI0- 빠른 버전은 교육 속도와 일반화 기능을 향상시키고 산업 자동화의 홍보를 가속화 할 것으로 예상됩니다.
"PI0"기술이 출시되면서 로봇 분야는 새로운 변화를 안내했으며 향후 더 지능적이고 편리 할 것입니다.