연구 결과: 대규모 언어 모델은 인간의 피드백을 통해 더 빠르고 스마트하게 학습합니다.
최근 연구에 따르면 대규모 언어 모델은 온라인 상황별 학습을 통해 인간의 피드백을 바탕으로 로봇 코딩 방법을 학습할 수 있는 힘을 입증했습니다. 연구팀은 LMPC 프레임워크를 통해 로봇 코드에서 LLM 작성 효율성을 성공적으로 향상시켜 로봇 학습 프로세스를 더욱 가속화했습니다. 실험을 통해 LMPC가 보이지 않는 작업의 성공률을 크게 향상시키고 로봇에게 다음과 같은 기능을 제공한다는 것이 입증되었습니다.
2025-02-02