인공 지능 분야에서 혁신적인 획기적인 혁신은 컴퓨터와 상호 작용하는 방식을 재구성하고 있습니다. Kunlun Wanwei는 Beijing Zhiyuan Artificial Intelligence Research Institute, Singapore Nanyang Technological University 및 Peking University와 같은 최고 기관과 함께 Cradle이라는 일반적인 컴퓨터 관리 프레임 워크를 공동으로 시작했습니다. 이 혁신적인 AI 프레임 워크는 전통적인 에이전트의 한계를 뚫고 인간과 같은 키보드와 마우스를 직접 조작 할 수 있으며 내부 API에 의존하지 않고 다양한 오픈 또는 폐쇄 소스 소프트웨어와 완벽하게 상호 작용할 수 있습니다. Cradle은 여러 상용 게임을 동시에 제어하고 다양한 소프트웨어 응용 프로그램, 프로젝트 데이터 및 소스 코드가 공개되어 AI 필드의 개발을 주입 할 수있는 최초의 AI 프레임 워크라는 점에서 독특합니다. 새로운 활력.
요람은 실제 응용 프로그램에서 놀랍고 다양한 유형의 게임에서 우수한 기능을 보여줍니다. Red Dead 2에서 40 분의 주요 임무를 수행하는 것부터 City Skyline에 수천 명의 사람들이있는 도시를 건설하는 것에서 Pawnshop Life 2의 고객과의 협상에 이르기까지 Cradle은 놀라운 적응성을 보여주었습니다. . 뿐만 아니라 Chrome, Outlook, Feishu 등과 같은 Daily Office 소프트웨어에 능숙 할 수 있으며 전문 사진 편집 및 비디오 편집을 수행하여 All-Round AI Assistant가 될 수도 있습니다.
Cradle의 성공은 정보 수집, 자기 반성, 작업 추론, 기술 관리, 행동 계획 및 메모리 모듈의 6 가지 핵심 구성 요소로 구성된 절묘한 시스템 아키텍처 덕분입니다. 원래 입력 및 출력을 영리하게 캡슐화하고 추상화함으로써 Cradle은 컴퓨터와 자연스러운 상호 작용을 가능하게합니다. 화면에 표시된 비디오 이미지를 기본 입력 소스로 사용하고 의사 결정을 위해 텍스트 및 시각 정보를 추출하며 키보드 및 마우스를 제어하는 신호를 출력합니다. Cradle의 의사 결정 및 추론 모듈은 소프트웨어 및 완전한 작업과 자발적으로 상호 작용할 수 있으며 과거에 대한 반성을 통해 작동하여 현재를 요약하고 미래를 계획하고 인간과 같은 사고 모델을 보여줍니다.
실제 테스트에서 Cradle의 성능은 다양성을 완전히 입증합니다. 완전히 다른 스타일과 운영 방법을 가진 게임의 복잡한 작업을 완료 할 수 있으며, 학술 논문 다운로드, 이메일 보내기, 이미지 처리, 비디오 편집 등과 같은 공통 소프트웨어에서 다양한 작업을 수행 할 수 있습니다. 더욱 주목할만한 점은 Cradle이 도전적인 벤치 마크 Osworld 테스트에서 진실 태그를 사용하여 기준 방법을 능가하여 강력한 학습 능력과 적응성을 보여줍니다.
요람의 출시는 GCC 에이전트의 개발에서 중요한 단계입니다. 그것은 통합 입력 및 출력 인터페이스의 개발을 촉진 할뿐만 아니라 다양한 환경에서 미래의 상호 작용 및 에이전트의 자기 개선을위한 견고한 토대를 마련 할뿐만 아니라 일반 인공 지능 (AGI)의 목표를 달성하기위한 중요한 단계를 취합니다. 이 혁신적인 프레임 워크의 탄생은 우리가 컴퓨터와 상호 작용하는 방식에 혁명을 일으키고 새로운 컴퓨터 협업 시대를 열어 줄 것입니다.
프로젝트 홈페이지 : https://baai-agents.github.io/cradle
코드 링크 : https://github.com/baai-agents/cradle