최근 대규모 언어 모델 기술이 급속히 발전했지만, 기존 AI 에이전트 대부분은 수동적으로 지시를 실행하고 주도력이 부족했다. 이 기사에서는 Tsinghua University와 Face Wall Intelligence가 공동 개발한 새로운 AI 에이전트를 소개합니다. 이 에이전트는 사용자 행동을 기반으로 요구 사항을 예측하고 사전에 도움을 제공하며 사용자 경험을 크게 향상시킬 수 있습니다. 에이전트는 다양한 사용자 행동을 기록하는 ProactiveBench라는 데이터 세트를 기반으로 훈련되며 AI 행동이 인간의 기대를 충족하는지 여부를 판단하고 궁극적으로 AI 이니셔티브를 실현하기 위한 보상 모델을 훈련하는 데 사용됩니다.
최근 몇 년 동안 ChatGPT로 대표되는 대규모 언어 모델은 AI 분야에 새로운 물결을 일으켰습니다. 이러한 강력한 언어 모델은 인간의 지시를 이해할 뿐만 아니라 계획을 세우고 환경을 탐색하며 도구를 사용하여 복잡한 작업을 해결할 수 있어 로봇 공학, 개인 비서 및 프로세스 자동화와 같은 분야에서 큰 잠재력을 보여줍니다.
하지만 기존 AI 에이전트 시스템은 대부분 수동적이어서 작업을 수행하려면 명확한 사람의 지시가 필요하다. 회의 일정을 잡으려면 시간과 장소를 수동으로 입력해야 하고, 심지어 참가자도 한 명씩 나열해야 한다. 스스로 하는 것보다 더 귀찮습니다!
동료로부터 회의를 제안하는 이메일을 받았고, 수동적 AI 에이전트가 귀하가 회의 일정을 지정하도록 명시적으로 지시할 때까지 기다린다고 상상해 보십시오. 활동 중인 AI 에이전트는 이메일을 인지하고 적극적으로 회의를 요청합니다. 이러한 능동적인 행동은 사용자의 인지 부하를 크게 줄일 뿐만 아니라 인간이 명확하게 표현하지 못한 잠재 요구 사항도 식별합니다.
AI 비서가 너무 수동적인 문제를 해결하기 위해 Tsinghua University와 Wall-Facing Intelligence는 더 이상 "말에 복종하는" 기계가 아니라 "예측할 수 있는" 새로운 AI 에이전트를 제안하기 위해 힘을 합쳤습니다. 알 수 없음"이라고 말하기 전에. 전에는 내가 주도적으로 일을 명확하게 정리할 수 있도록 도와주었습니다!
이 "마법의" AI 에이전트는 어떻게 작동합니까? 비밀 무기는 ProactiveBench 데이터 세트입니다! 이 데이터 세트는 컴퓨터 앞에 입력하는 모든 정보를 포함하여 다양한 인간 활동을 기록하는 "백과사전"과 같습니다. 링크를 클릭하면 복사해서 붙여넣은 내용까지 선명하게 기록됩니다!
연구원들은 이 데이터 세트를 사용하여 "인간의 두뇌를 시뮬레이션"하고 AI 에이전트의 행동이 인간의 기대와 일치하는지 여부를 판단할 수 있는 슈퍼컴퓨터와 같은 보상 모델을 훈련했습니다. AI 에이전트의 성능이 좋으면 보상을 주고, 그렇지 않으면 포인트가 차감됩니다. 반복적인 훈련을 거친 후 AI 에이전트는 인간과 마찬가지로 사용자의 행동을 기반으로 사용자의 요구 사항을 예측하고 필요할 때 적극적으로 도움을 제공할 수 있습니다.
예를 들어, 동료로부터 회의를 제안하는 이메일을 받으면 이 "예측" AI 에이전트는 자동으로 이메일 내용을 식별하고 회의 일정을 잡아야 하는지 사전에 묻습니다. 동의하면 자동으로 시간과 장소를 정하는 데 도움이 되며 회의 초대장도 보내줍니다. 오늘날의 AI 비서보다 훨씬 "똑똑"합니까?
실험 결과에 따르면 ProactiveBench 데이터 세트를 사용하여 훈련된 AI 에이전트의 성능이 매우 뛰어납니다. 예를 들어 Qwen2-7B-Instruct 모델은 적극적으로 도움을 제공하는 데 있어 F1 점수가 66.47%로 모든 오픈 소스 및 비공개 소스 모델을 능가합니다.
이 "예측" AI 에이전트는 아직 연구 단계에 있지만 인간-기계 협업의 미래 발전에 대한 새로운 희망을 제시합니다. 가까운 미래에 우리는 진정으로 "당신을 이해"하는 AI 비서를 갖게 될 것이라고 믿습니다. 이는 "당신에게 복종"할 수 있을 뿐만 아니라 당신의 다양한 문제를 적극적으로 해결하여 당신의 삶을 더 쉽고 편리하게 만들어 줄 수 있습니다!
논문 주소: https://arxiv.org/pdf/2410.12361
이번 연구 결과는 AI 에이전트가 액티브 서비스 방향으로 발전할 수 있는 큰 잠재력을 보여줍니다. ProactiveBench 데이터 세트의 적용은 미래 AI 모델 학습을 위한 새로운 아이디어도 제공합니다. 저는 기술이 지속적으로 발전함에 따라 AI 비서가 미래에는 더욱 똑똑해지고 인간의 요구에 더 잘 대응할 것이며 진정으로 우리 삶의 강력한 비서가 될 것이라고 믿습니다.