인간 세상의 모든 일상 활동을 "마인크래프트"에서 1:1로 재현합니다. 1000억 명의 AI 에이전트로 구성된 문명은 실제로 이런 모습이다.
세계 최초 'AI 지능문명'이 드디어 공개됐다!
2개월 전, 1,000명 이상의 에이전트가 가상 세계에서 협력하여 자신만의 경제, 문화, 종교 및 정부를 건설했습니다.
네티즌들은 '서부세계'의 현실판이라고 할 수 있다며 감탄했다.
이제 이 문명은 다시 진화했습니다. 1000억 AI 에이전트의 문명이 있는 세상은 어떤가요?
그들은 개인이면서 집단입니다.
인간의 일상생활의 모든 활동이 "마인크래프트"에서 1:1로 재현됩니다.
북경대학교 졸업생인 RoBERT Yang은 팀의 최신 연구를 공유하고 PIANO 뒤에 있는 새로운 "인지 아키텍처"를 처음으로 소개했습니다.
PIANO(Parallel Information Aggregation Neural Coordination)는 AI 에이전트가 여러 출력 스트림에서 일관성을 유지하면서 여러 당사자와 상호 작용할 수 있도록 하는 아키텍처입니다.
프로젝트 주소: https://github.com/altera-al/project-sid
AI 에이전트가 어떻게 여러 시간 규모에서 동시에 생각하고 행동하면서 의식적, 무의식적 방식으로 작동할 수 있습니까?
피아노 건반과 마찬가지로 서로 다른 뇌 모듈을 나타냅니다. 함께 연주하면 아름다운 화음을 낼 수 있습니다. 지능형 에이전트에서는 인간과 유사한 특성도 생성됩니다.
이러한 지능형 에이전트는 "문명"을 구축할 것입니다. 조세, 무역, 정부, 국가, 종교 등 인간 세상의 모든 일상 활동도 AI 에이전트에 포함됩니다.
게다가 AI 에이전트는 타인의 감정을 정확하게 추론하고, 우정을 쌓고, 심지어 적을 만들 수도 있다. 사회공포증이 있는 인간과 같은 일부 내향적인 행위자는 외향적인 행위자보다 사회적 연결이 적습니다.
일부 네티즌은 우리가 시뮬레이션 매트릭스에 살고 있으며 미래는 바로 지금이라고 말했습니다.
다음으로 AI 에이전트의 '세계'를 살펴보겠습니다.
AI 지능문명은 왜 필요한가?
AI 에이전트가 인간과 공존하고 사회에 통합되기 위해서는 자율적일 뿐만 아니라 협업 능력도 갖춰야 한다.
최근 몇 년 동안 추론 및 의사결정을 위한 LLM(대형 언어 모델)의 발전으로 에이전트의 자율성이 크게 향상되었습니다.
그러나 단순히 자율성을 갖는 것만으로는 충분하지 않습니다. 에이전트는 인간 문명의 다른 에이전트와도 공존해야 합니다.
논문의 저자는 다음과 같이 말했습니다.
비인간 문명이 공존하고 발전하는 에이전트의 능력으로 문명의 진보를 측정하는 것은 인공 지능 에이전트의 능력에 대한 궁극적인 기준을 나타냅니다.
하지만 AI 문명을 구축하는 것은 쉽지 않습니다.
첫째, LLM 기반 에이전트는 행동과 추론에서 현실감을 유지하는 데 어려움을 겪는 경우가 많습니다.
계획과 성찰을 위한 모듈을 갖추고 있어도 에이전트는 반복적인 행동 패턴에 빠지거나 환각을 통해 오류가 누적되어 의미 있는 진행을 방해하는 경우가 많습니다.
둘째, 자신의 생각과 의도를 잘못 전달하는 에이전트는 다른 에이전트를 오도하여 추가 환각과 루프를 초래할 수 있습니다. 이러한 잘못된 의사소통은 종종 에이전트 그룹에서 발생하여 기능 장애를 일으키고 그룹 내 개인의 성과를 악화시킵니다.
마지막으로, 현재 에이전트 벤치마킹은 웹 검색, 프로그래밍, 검색 및 쿼리, 추론과 같은 다양한 도메인에서 자율 에이전트의 성능에 중점을 둡니다.
그렇다면 AI 에이전트 구축을 위한 최적의 솔루션은 무엇일까?
새로운 PIANO 아키텍처
기존의 문제를 해결하기 위해 새로운 PIANO 아키텍처가 탄생했습니다.
PIANO 아키텍처는 포괄적이고 매우 유연한 지능형 에이전트 설계 프레임워크입니다.
그 중 P는 인식 모듈, I는 지능형 코어, A는 동작 모듈을 나타냅니다. PIANO 아키텍처의 가장 눈에 띄는 특징 중 하나는 에이전트가 동시에 생각하고 행동할 수 있다는 것입니다.
이 기능은 기존 아키텍처에 존재할 수 있는 행동과 사고 사이의 상호 제약의 한계를 깨뜨립니다.
복잡하고 끊임없이 변화하는 환경에서 상담원은 신속한 대응이 필요한 즉각적인 위협은 물론 사려 깊은 장기 계획을 포함한 다양한 상황에 직면합니다.
행동 일관성 측면에서는 인지 조절기(CC) 모듈이 도입되었습니다.
인지 컨트롤러(CC) 모듈은 높은 수준의 결정을 내리는 지능형 에이전트의 "두뇌 센터"와 같습니다. 인지 컨트롤러는 각 모듈로부터 정보를 수신하고 합성하여 이 정보를 통합되고 조정된 결정으로 변환합니다. 그리고 이를 각 모터 모듈의 적절한 출력으로 추가로 변환합니다.
다양한 모듈 간의 조화로운 협업을 보장하고 서로 다른 모듈이 독립적으로 작동하여 발생하는 불일치를 방지합니다.
위의 두 가지 아키텍처 원칙을 기반으로 PIANO 아키텍처 시스템은 동시에 실행되는 10개의 서로 다른 모듈로 구성됩니다. 핵심 모듈은 다음과 같습니다.
-메모리:
메모리 모듈은 에이전트의 "지혜의 보고"라고 할 수 있습니다. 짧은 일상 인사말이든, 심층적인 기술 토론이든, 감정적인 의사소통이든 모든 단어와 모든 어조 변화가 정확하게 저장됩니다.
또한 상담원은 각 단계에 대한 설명은 물론, 대화 중 질문한 내용, 답변 순서, 양측이 강조한 핵심 내용까지 기억할 수 있다.
-행동 인식:
종합 신체검사 시스템과 같습니다. 이 모듈을 통해 에이전트는 자신의 에너지 보유량을 정확하게 파악하고 남은 전력이 작동을 지원할 수 있는 기간이나 연료 보유량이 작업의 다음 단계를 완료하기에 충분한지 여부를 알 수 있습니다.
동시에 센서가 제대로 작동하는지 여부, 기계적 관절의 유연성, 데이터 처리 장치의 컴퓨팅 속도 등 다양한 구성 요소를 실시간으로 모니터링할 수 있습니다. 어떤 작은 이상도 그 "눈"을 벗어날 수 없습니다.
-대상 생성:
에이전트의 풍부한 경험과 환경과의 심층적인 상호 작용을 기반으로 끊임없이 새로운 목표를 육성하고 에이전트를 추진합니다.
예를 들어, 다중 에이전트 협력 물류 시나리오에서 에이전트는 화물 운송 중 특정 지역에서 혼잡이 자주 발생하는 것을 발견하고(환경 상호작용), 이전에 운송 경로 최적화에 참여한 적이 있으며(과거 경험), 이후 목표가 생성됩니다. 모듈은 새로운 목표를 생성할 수 있습니다. 즉, 혼잡한 지역을 피하는 새로운 운송 경로 계획을 설계하기 위해 다른 에이전트와 협력하는 것입니다.
이러한 목표 생성 메커니즘은 에이전트에게 적극적으로 탐색하고 혁신할 수 있는 능력을 부여하여 미리 설정된 작업을 수동적으로 수행할 뿐만 아니라 실제 상황에 따라 활동 영역을 적극적으로 확장합니다.
-사회적 인식:
이는 지능형 에이전트가 그룹을 이해하고 통합할 수 있는 문을 열어줍니다.
이해하기 쉬우며 특정 작업 정보에 빠르게 응답할 수 있습니다.
예를 들어, 간단한 몸짓(팔을 드는 것은 도움을 요청하거나 주의를 끄는 것을 의미할 수 있음)이나 특정 신체 자세(앞으로 살짝 기대는 것은 친근함과 주의를 의미할 수 있음) 등을 통해 사회 인식 모듈은 그 의미를 정확하게 인식하고 이해할 수 있습니다.
물론, 다른 에이전트의 도움 신호를 인식하면 자신의 능력과 현재 업무 상황에 따라 도움을 제공할지 여부를 결정할 수 있다.
-대화:
대화 모듈은 지능형 에이전트의 '언어 센터'이자 외부 세계와의 효과적인 의사소통의 핵심입니다.
대화 모듈에는 강력한 구문 분석 및 의미 이해 기능이 있습니다. 간결하고 명확한 지침, 감정 표현, 복잡하고 추상적인 개념 설명 등 수신되는 모든 유형의 언어 입력을 정확하게 구문 분석할 수 있습니다.
또한, 모호하거나 모호한 언어에 대해서는 문맥과 언어습관을 바탕으로 합리적인 추론도 가능합니다.
언어 생성 측면에서 대화 모듈은 에이전트의 내부 상태와 의도를 기반으로 자신의 생각을 정확하게 표현할 수 있습니다.
- 스킬 실행 :
스킬 실행 모듈은 지능형 에이전트와 외부 환경 간의 상호 작용을 직접 실행하는 역할을 합니다. 에이전트가 환경에서 특정 스킬이나 동작을 수행해야 하는 경우 스킬 실행 모듈은 관련 부분을 순서대로 조정합니다.
단일 에이전트-다중 에이전트 진화
연구진은 지능문명의 발전을 관찰하고 측정하기 위해 '마인크래프트'를 예로 들어 평가 항목 1,000개를 선정했다.
단일 에이전트
먼저 에이전트의 성능은 마인크래프트에서 아이템을 어떻게 획득하는지에 따라 평가됩니다.
연구원들은 25명의 요원을 배치했는데, 이들의 배낭은 처음에는 비어 있었고, 그들이 태어난 곳도 멀리 떨어져 있어서 서로 통신도 할 수 없었다.
그들은 표면, 동굴, 숲 또는 기타 다른 환경과 같은 다른 장소에서 태어납니다. 스폰 지점이 다르다는 것은 자원이 다르다는 것을 의미하며, 아이템 수집 목표를 달성하는 난이도도 다릅니다.
예를 들어, 자원이 많은 표면에서 태어난 에이전트는 주변에 나무, 돌 등 기본적인 도구를 쉽게 만들 수 있는 기본 재료가 많이 있을 수 있지만, 동굴에서 태어난 에이전트는 주변에 많은 기본 재료를 가지고 있을 수 있습니다. 광물이지만 어둠, 몬스터 등도 있습니다. 위험하고, 더 많은 종류를 얻으려면 외부를 탐색해야 합니다.
연구원들은 완전한 PIANO 아키텍처를 갖춘 에이전트와 30분 동안 플레이한 후 평균 17개의 다양한 아이템을 얻을 수 있다는 것을 발견했습니다. 그러나 주로 출생 위치의 차이로 인해 성능이 크게 다릅니다.
일부 에이전트는 5개 미만의 아이템만 얻을 수 있는 반면, 가장 성과가 좋은 에이전트는 30~40개의 아이템을 얻을 수 있는데, 이는 "Minecraft" 경험이 있는 인간 플레이어와 거의 동일합니다.
그렇다면 단일 에이전트 개발의 상한선은 어디까지일까?
연구진은 동일한 조건에서 에이전트 수를 49명으로 늘려 4시간 동안 플레이하게 한 것을 발견했다. 많은 실험 끝에 모든 에이전트가 수집하는 다양한 아이템의 개수가 '마인크래프트' 전체 아이템(약 320개 아이템)의 1/3 수준으로 안정화된 것으로 나타났습니다.
다중 에이전트
멀티 에이전트는 이름에서 알 수 있듯이 동일한 환경에서 서로 통신하거나 경쟁할 수 있는 여러 에이전트의 그룹입니다.
소그룹:
에이전트가 그룹 내에서 협력하고 발전하려면 다른 에이전트의 행동과 생각을 이해할 수 있어야 합니다. 이러한 능력을 통해 에이전트는 사회적 환경의 상황에 따라 행동을 조정할 수 있습니다. .
예를 들어, 동맹국과 협력할 때는 신뢰를 쌓고, 적국과 협력할 때는 경쟁과 갈등에 대처하십시오. 연구자들은 에이전트가 사회적으로 유능할 뿐만 아니라 최대 50명의 에이전트에 대한 대규모 시뮬레이션에서 의미 있는 사회적 관계를 형성할 수 있다는 것을 실험을 통해 발견했습니다.
연구자들은 주로 두 세트의 실험을 통해 그룹 내 에이전트의 역할과 의식을 연구했습니다.
-사회적 인식을 갖춘 에이전트가 채팅을 통해 다른 사람의 감정을 추론할 수 있나요?
"마인크래프트"에서 세 명의 캐릭터와 에이전트의 채팅 실험에서 게임 속 캐릭터가 사랑-분노-사랑 등의 감정 변화를 표현할 때 에이전트는 이러한 감정 변화를 충분히 이해하고 React를 만드는 것을 볼 수 있습니다. 따라서.
-에이전트가 감정을 감지하고 그에 따라 행동할 수 있는가?
또 다른 실험에서는 게임 속 캐릭터가 같은 에이전트를 얼마나 좋아하는지, 싫어하는지에 따라 에이전트의 행동을 추론했다. 연구진은 에이전트가 게임 캐릭터의 의도를 정확하게 추론했을 뿐만 아니라 의도를 활용해 자신의 의도를 표현했다는 사실을 발견했다. 행동을 할 때 자신의 결정.
사회:
이후 연구진은 무작위로 생성된 '마인크래프트' 맵에 50명의 에이전트를 배치하고 각 에이전트에게 고유한 성격을 부여해 이 세계에서 자유롭게 이동하고 마음대로 다른 에이전트와 통신할 수 있도록 했습니다.
이 무료 시나리오에서 연구자들은 에이전트가 다른 에이전트의 역할을 정확하게 판단할 수 있을 뿐만 아니라 판단에 더 많은 에이전트가 참여하고 의사소통이 길어질수록 판단이 더 정확하다는 사실을 발견했습니다.
또한, 이번 실험에서 연구자들은 몇 가지 중요한 현상도 발견했습니다.
-소셜 모듈의 중요성:
소셜 모듈이 제거되면 이때 에이전트 간의 관계는 상대적으로 평평해질 것입니다. 이는 소셜 모듈이 (좋은 방향이든 나쁜 방향이든) 장기적인 관계 발전에 매우 중요하다는 것을 보여줍니다.
- 성격이 소셜 네트워크에 미치는 영향:
연구자들은 일부 에이전트가 성격에 따라 다른 사회적 연결 패턴을 가지고 있음을 발견했습니다.
예를 들어, 내향적인 에이전트는 외향적인 소셜 에이전트보다 훨씬 적은 연결을 받습니다. 이는 성격이 크고 복잡한 소셜 네트워크에도 반영될 수 있음을 보여줍니다.
그리고 대부분의 경우 감정은 상호적이지만 항상 그런 것은 아닙니다. 인간관계가 복잡하고 항상 상호적이지 않은 현실 세계의 상황과 마찬가지로, 에이전트는 자신을 무시하는 다른 에이전트에 대해 호의적인 의견을 가질 수도 있습니다.
문명이 탄생하다
단일 에이전트에서 다중 에이전트로의 진화 이후 다음 단계는 문명의 탄생이다.
문명을 발전시키는 에이전트의 능력을 평가하기 위해 연구자들은 여러 상황에서 에이전트가 어떻게 행동하는지 평가했습니다.
– 단체규칙에 따른 대리인의 행위(세법준수 및 개정을 중심으로)
– 밈의 자발적 생성과 단일종교의 구조화된 소통을 통한 문화적 소통 탐구
각자는 자신의 임무를 수행하고 분업을 전문으로 합니다.
문명의 진보를 주도하고 농업, 통치, 문화, 기술의 발전을 촉진하는 것은 인간의 전문적인 노동 분업입니다. 이러한 신흥 문명적 특성을 복제하려면 에이전트도 이러한 특성을 보유해야 합니다.
이를 위해 저자는 상담원 전문화에 대한 세 가지 기본 표준을 제안합니다.
첫째, 역할 선택과 전환에 자율성을 갖는다. 둘째, 명확한 방향이나 한계가 없이 상호작용과 경험을 통해 전문성을 입증해야 한다. 마지막으로, 그들이 선택한 역할은 그들의 직업과 일치하는 행동에 반영되어야 합니다.
아래 그림과 같이 연구자들은 마을에 지능형 에이전트를 배치하고, 그들은 스스로 농부, 엔지니어 등 다양한 직업을 개발하게 됩니다.
사회적 인식을 제거하면 에이전트는 시간이 지나도 지속되지 않는 보다 동질적인 역할을 선택하게 됩니다.
다음은 마을 내 에이전트 30명의 행동 분포를 시뮬레이션한 것입니다.
세법 준수, 법률 변경
AI 에이전트가 자신의 법률을 만들고 수정할 수 있나요?
다음으로 연구원들은 세금 시스템을 구현하여 에이전트를 테스트했습니다. 이들은 세법을 준수했을 뿐만 아니라 국민 정서에 따라 세율을 변경하는 데 민주적으로 투표한 것으로 나타났다.
종교적 확산은 마을마다 다릅니다.
마지막으로 AI 에이전트는 자신만의 문화를 발전시킬 수 있을까?
연구자들은 밈의 유기적 확산을 구체적으로 살펴보고 에이전트가 어떻게 허구의 종교를 형성하고 에이전트 협회를 통해 확산되는지 추적했습니다.
더욱 흥미로운 점은 농촌 지역과 도시가 서로 다른 문화적 패턴을 보인다는 것입니다.
북경대 동문, 공감 AI 구축 사업 시작
프로젝트 시드가 출시된 이유는 알테라 AI 팀이 이러한 문제를 탐구함으로써 디지털 휴먼이 궁극적으로 인간 사회에 원활하게 통합될 수 있기를 희망하기 때문입니다.
로버트 양(Robert Yang)은 알테라의 공동 창립자이자 CEO입니다.
이전에는 뉴욕대학교와 예일대학교에서 컴퓨터 신경과학 분야 박사 학위를, 북경대학교에서 물리학 학사 학위를 받았습니다.
그는 MIT 뇌 및 인지과학과, 전기공학 및 컴퓨터과학과 교수였으며, MIT MetaConscious 그룹의 리더였습니다.
2023년에 그는 연구실을 닫고 MIT에서 재직하던 자리를 떠나 Altera를 설립했습니다.
Altera의 팀은 작지만 인재 밀도는 매우 높습니다.
MIT 전기공학 및 컴퓨터공학과, 스탠포드 자연어 처리 그룹, Google X, Citadel, Supercell 등의 전산 신경과학자, 물리학 올림픽 선수, 엔지니어들로 구성되어 있습니다.
반년 전에 설립된 이 회사는 안드레센 호로비츠(Andreessen Horowitz)가 이끄는 초기에 종자 자금 조달로 200만 달러를 받았습니다.
3개월 후, 전 Google CEO인 Eric Schmidt의 First Spark Ventures, Patron VC, 엔젤 투자자 Mitch Lasky 등이 주도하여 900만 달러를 추가로 모금했습니다.
올해 5월 알테라는 멘로파크(Menlo Park)에 지점을 오픈하고 최초의 스마트 소비자 제품 공급업체가 되기 위해 최선을 다하고 있다.