GLM-PC 개방형 경험 멀티모달 에이전트 업그레이드를 통해 컴퓨터를 자율적으로 작동 - AI 기사

저자：Eve Cole 업데이트 시간：2025-01-28 14:32:01

Beijing Zhipu Huazhang Technology Co., Ltd.는 다중 모드 지능형 에이전트 GLM-PC 경험을 공식적으로 공개하여 인간과 컴퓨터 상호 작용의 새로운 이정표를 세웠습니다. GLM-PC는 Wisdom의 다중 모드 대형 모델 CogAgent를 기반으로 하며, 컴퓨터를 자율적으로 작동하고 사용자에게 더 스마트하고 효율적인 컴퓨터 경험을 제공할 수 있습니다. 간단한 입력 조작만으로 코드 생성, 논리적 추론, GUI 이해 등 강력한 기능을 경험할 수 있어 작업 효율성이 크게 향상됩니다. GLM-PC는 11월 29일 출시 이후 내부 테스트 단계에 있었습니다. 이번 업그레이드는 대중에게 더욱 완벽한 기능과 보다 원활한 사용자 경험을 제공합니다.

GLM-PC v1.0은 2024년 11월 29일 출시된 이후 내부 테스트 단계에 있습니다. 이 버전은 "깊은 사고" 모드, 새로운 논리적 추론 및 코드 생성 기능을 제공하며 Windows 시스템도 지원합니다. GLM-PC의 기능은 코드 생성, 논리 실행, 그래픽 사용자 인터페이스(GUI) 이해 등 다양한 측면을 다루며 지능형 작업에서 강력한 잠재력을 보여줍니다.

코드 생성 및 논리 실행 측면에서 GLM-PC는 목표와 리소스를 종합적으로 분석하고 실행 로드맵을 생성하며 대규모 작업을 관리 가능한 작은 하위 작업으로 분해하여 효율적인 작업 계획을 달성하는 기능을 갖추고 있습니다. 작업 계획이 완료된 후 에이전트는 주기적 실행을 위한 코드 생성 모듈을 시작하여 작업의 정확한 완료를 보장할 수 있습니다. 동시에 GLM-PC는 장기적으로 생각할 수 있는 능력도 갖추고 있으며 실시간으로 수정 사항을 조정 및 반영하고 사용자와 상호 작용하여 솔루션을 최적화할 수 있습니다.

이미지 및 GUI 인식 측면에서 GLM-PC는 버튼, 아이콘 등 그래픽 인터페이스의 요소를 정확하게 식별하고 이해하며 사용자의 과거 작업 정보를 기반으로 지능적인 권장 사항을 제공할 수 있습니다. 이미지 의미 분석 기능을 통해 복잡한 이미지를 심층적으로 분석하고 트렌드, 지표 등 핵심 정보를 추출할 수 있습니다. 또한 GLM-PC는 이미지와 텍스트 정보를 융합하여 사용자에게 포괄적인 인식 결과를 제공하고 사용자가 정확한 작업 계획을 수립하는 데 도움을 줄 수 있습니다.

인공 지능 기술이 지속적으로 발전함에 따라 GLM-PC의 출시는 의심할 여지 없이 사용자에게 보다 효율적이고 지능적인 컴퓨터 경험을 제공하여 인간과 컴퓨터의 상호 작용에 중요한 진전을 가져올 것입니다.

GLM-PC의 개방형 경험은 인간-컴퓨터 상호작용의 효율성을 향상시키는 인공지능 기술의 엄청난 잠재력을 보여주며, 앞으로 더 많은 분야에 적용되어 사용자에게 더욱 편리하고 지능적인 생활 경험을 제공할 것으로 예상됩니다. 앞으로도 GLM-PC가 지속적으로 개선되어 사용자에게 더 많은 놀라움을 선사할 수 있기를 기대합니다.