로봇 조작 분야의 데이터 규모에 대한 연구는 항상 로봇 학습 분야에서 중요한 과제였습니다. 기존의 연구는 자연 언어 처리 및 컴퓨터 비전 분야에 중점을 두는 반면 로봇 조작 분야에 대한 연구는 상대적으로 부족합니다. 이 기사는 Tsinghua University의 연구 팀의 최신 연구 결과를 소개합니다.이 연구는 로봇 모방 학습의 데이터 스케일 패턴을 발견하고 로봇 전략의 일반화 능력을 크게 향상 시켰습니다.
딥 러닝의 빠른 개발은 대규모 데이터 세트, 모델 및 계산량과 분리 할 수 없습니다. 자연 언어 처리 및 컴퓨터 비전 분야에서 연구원들은 모델 성능과 데이터 규모 사이의 전력 법률 관계를 발견했습니다. 그러나 로봇 분야, 특히 로봇 조작은 아직 비슷한 규모의 법칙을 확립하지 못했습니다.
Tsinghua University의 연구팀은 최근 로봇 모방 학습의 데이터 규모를 탐구하는 논문을 발표했으며, 새로운 데이터 수집 전략을 제안했습니다. 환경과 새로운 대상.
연구원들은 일반화 기능을 환경 일반화와 객체 일반화의 두 가지 차원으로 나누고 휴대용 턱을 사용하여 다양한 환경과 다른 대상에 대한 인간 데모 데이터를 수집하고 확산 전략을 사용하여 이러한 데이터를 모델링했습니다. 연구원들은 먼저 물과 마우스 배치의 두 가지 작업에 중점을 두었습니다. 새로운 환경이나 새로운 객체의 전략이 객체 수가 증가하는 방식을 분석하여 데이터 척도 규칙을 요약했습니다.
연구 결과는 다음과 같습니다.
새로운 물체, 새로운 환경 또는 둘 다에 대한 전략의 일반화 능력은 각각 교육 대상, 교육 환경 또는 훈련 환경 객체 쌍의 수와 관련된 전력 법입니다.
환경과 물체의 다양성을 높이는 것은 각 환경이나 물체의 데모 수를 늘리는 것보다 효과적입니다.
가능한 한 많은 환경 (예 : 32 개 환경)에서 데이터를 수집, 고유 한 운영 객체와 각 환경에서 50 개의 데모를 사용하여 강력한 일반화 능력 (90% 성공률)으로 전략을 훈련시켜 새로 운영 할 수 있습니다. 환경과 새로운 대상.
이러한 데이터 규모 법칙을 바탕으로 연구원들은 효율적인 데이터 수집 전략을 제안했습니다. 각 환경에서 하나의 고유 한 객체 만 사용하여 가능한 많은 다양한 환경에서 데이터를 수집하는 것이 좋습니다. 총 환경 객체 쌍의 총 수가 32에 도달하면 일반적으로 새로운 환경에서 작동하고 이전에는 보지 못한 객체와 상호 작용할 수있는 전략을 훈련시키는 것이 충분합니다. 각 환경 객체 쌍의 경우 50 개의 데모를 수집하는 것이 좋습니다.
데이터 수집 전략의 보편적 인 적용 가능성을 확인하기 위해 연구원들은이를 두 가지 새로운 작업, 즉 수건을 접고 충전기를 뽑는 두 가지 새로운 작업에 적용했습니다. 결과는이 전략 이이 두 가지 새로운 작업에서 강력한 일반화 기능으로 전략을 훈련시킬 수 있음을 보여줍니다.
이 연구는 상대적으로 적은 시간과 자원을 투자함으로써 모든 환경과 물체에 배치 할 수있는 단일 작업 전략을 배울 수 있음을 보여줍니다. 이와 관련하여 연구원의 노력을 더욱 지원하기 위해 Tsinghua 팀은 코드, 데이터 및 모델을 발표하여 해당 분야에 대한 추가 연구에 영감을주고 궁극적으로 복잡한 개방형 문제를 해결할 수있는 보편적 인 로봇을 구현하기를 희망합니다.
종이 주소 : https://arxiv.org/pdf/2410.18647
이 연구는 로봇 모방 학습을위한 중요한 이론적 지침과 실용적인 방법을 제공하며보다 일반화 된 로봇 지능형 시스템을 구축하기위한 견고한 토대를 마련합니다. 이 연구 결과의 오픈 소스는 다른 연구자 들이이 분야의 발전을 촉진 할 수있는 귀중한 자원을 제공합니다.