Downcodes의 편집자는 다음과 같이 보고했습니다. Baichuan Intelligence는 Tianjin University와 협력하여 Sibyl System이라는 에이전트 프레임워크를 개발했습니다. 이 시스템은 Meta, Huggingface 및 AutoGPT가 공동으로 시작한 GAIA 리더 보드 평가에서 1위를 차지했습니다. GAIA 평가는 복잡한 작업에서 에이전트의 실행 기능과 솔루션 설계를 평가하는 데 중점을 두고 있으며 실제 애플리케이션 시나리오에 더 가까운 질문을 테스트하고 AI 모델에 매우 높은 과제를 제시합니다. 이번 성과는 복잡한 작업 처리 분야에서 중국 AI 기술의 획기적인 진전을 의미한다.
Baichuan Intelligence는 Tianjin University와 협력하여 Sibyl System 지능형 에이전트 프레임워크를 출시하고 GAIA 리더 보드에서 1위를 차지했습니다. GAIA는 Meta, Huggingface 및 AutoGPT가 2023년 11월에 제안한 새로운 평가 체계입니다. 주로 복잡한 작업을 실행하는 데 있어 에이전트의 능력과 솔루션을 평가합니다. 본 평가 계획은 기존 모델의 역량 부족을 드러내고, 모델 및 Agent 개발에 대한 개선 방향을 제시합니다.
GAIA의 시험 문제는 실제 세계에 더 가깝고 AI가 추론, 다중 모드 이해(텍스트, 그림, 오디오/비디오), 웹 브라우징 및 도구 사용 기능을 갖추어야 합니다. 이러한 질문은 인간이 이해하기 어렵지 않지만 모델에게는 매우 어려운 질문입니다. 예를 들어, GPT-4의 테스트 성공률은 15%에 불과한 반면, 인간 실험에서는 92%를 달성할 수 있었습니다. 이러한 문제를 해결하려면 여러 단계와 도구가 포함된 긴 논리적 링크와 시간이 필요한 경우가 많습니다.
Sibyl System 프레임워크의 디자인 기능은 다음과 같습니다.
인간과 유사한 브라우저 인터페이스 대체 검색 강화 생성.
질문 및 답변은 상태 비저장 질문 및 답변 기능을 사용하여 시스템 아키텍처를 단순화하여 대화를 대체합니다.
전문 도구에 대한 의존도를 줄이려면 웹 브라우저와 Python 환경이라는 두 가지 일반적인 도구만 사용하세요.
System1부터 System2까지 '배심원단' 메커니즘을 도입해 다중 에이전트 토론을 통해 자기비판과 교정을 진행하고, 글로벌 워크스페이스의 정보를 활용해 답변의 정확성을 높인다.
Sibyl 시스템은 소수의 도구를 사용하여 복잡한 추론 문제를 해결할 수 있는 대규모 언어 모델을 기반으로 하는 간단하지만 강력한 에이전트 프레임워크입니다. Global Workspace 및 Multi-Agent 메커니즘과 브라우저 기반 범용 정보 획득 채널을 도입하여 시스템 복잡성을 줄이는 동시에 문제 해결의 복잡성을 확장하고 모델의 "빠른 사고"에서 "느린 사고" 변화로의 전환을 실현합니다. . Sibyl System은 확장성이 좋고 디버깅도 쉽습니다. 다른 모델의 Agent 모듈을 쉽게 교체하고 모델의 기능을 향상시킬 수 있습니다.
기술 보고서: https://arxiv.org/pdf/2407.10718
Sibyl 시스템 프레임워크의 성공은 인공 지능 분야에서 Baichuan Intelligence와 Tianjin University의 강력한 강점을 보여줄 뿐만 아니라 미래 지능형 에이전트 프레임워크의 설계 및 개발을 위한 귀중한 경험과 참고 자료를 제공합니다. 저는 가까운 미래에 Sibyl System 프레임워크를 기반으로 하는 더욱 혁신적인 애플리케이션을 보게 될 것이며 인공지능 기술의 발전을 더 깊은 수준으로 촉진할 것이라고 믿습니다.