Google의 Gemini 2.0 주요 릴리스는 인공 지능이 에이전트 시대로 나아가는 중요한 단계입니다. 이 업그레이드는 성능을 크게 향상시킬 뿐만 아니라 다중 모드 기능과 기본 도구 사용에 있어 획기적인 발전을 이루었습니다. Gemini 2.0은 텍스트, 이미지, 비디오, 오디오 등 다양한 형태의 입력을 지원하고 네이티브 이미지 생성, 텍스트 음성 변환 등 다중 모드 출력 기능을 최초로 지원하여 정보를 보다 유용하게 만드는 것을 목표로 합니다. Google은 Gemini 2.0을 Google 검색 및 새로 출시된 'Deep Research' 기능과 같은 제품 생태계에 신속하게 통합하여 사용자 경험을 더욱 향상시킬 계획입니다.
Google은 오늘 회사의 가장 강력한 AI 모델인 최신 세대 인공 지능 모델 Gemini 2.0의 출시를 발표했습니다. 이번 대대적인 업그레이드는 성능을 크게 향상시킬 뿐만 아니라 인공지능이 에이전트 시대로 나아가는 중요한 단계입니다.
Google 및 Alphabet의 CEO인 Sundar Pichai에 따르면 Gemini 2.0은 다중 모드 기능과 기본 도구 사용 측면에서 획기적인 발전을 이루었습니다. 새로운 모델은 텍스트, 이미지, 비디오, 오디오 등 다양한 형태의 입력을 이해하고 처리할 수 있을 뿐만 아니라 네이티브 이미지 생성, 텍스트 음성 변환 등 다중 모드 출력 기능도 최초로 지원합니다.
피차이는 “제미니 1.0이 정보를 정리하고 이해하는 것에 관한 것이라면, 제미니 2.0은 정보를 더욱 유용하게 만드는 것에 관한 것”이라고 말했다. 현재 이 모델은 개발자와 신뢰할 수 있는 테스터에게 공개되어 있습니다.
기술 혁신 및 성능 개선Google DeepMind의 CEO인 Demis Hassabis는 첫 번째 릴리스가 Gemini 2.0 Flash의 실험 버전이라고 밝혔습니다. 이 버전은 낮은 대기 시간을 유지하면서 성능이 크게 향상되었습니다. 특히, 2.0 Flash는 주요 벤치마크에서 1.5 Pro를 능가하여 반응성이 두 배나 향상되었습니다.
새 모델은 Google의 6세대 TPU Trillium 하드웨어 플랫폼에서 실행됩니다. 이 플랫폼은 Gemini2.0의 100% 학습 및 추론을 지원하는 인프라이기도 합니다. 현재 이 플랫폼은 고객에게 공개되어 있습니다.
실제 적용 및 제품 통합Google은 Gemini 2.0을 제품 생태계에 신속하게 통합할 계획입니다. 이제 전 세계 Gemini 사용자는 웹 버전을 통해 2.0 Flash 실험 버전을 사용할 수 있으며, 모바일 애플리케이션 버전도 곧 출시될 예정입니다. 또한 Google 검색의 AI 개요 기능은 2.0의 고급 추론 기능을 통합하여 보다 복잡한 주제와 다단계 문제를 해결합니다.
Google이 Gemini Advanced에서 사용할 수 있는 "Deep Research"라는 새로운 기능을 출시했다는 점도 주목할 만합니다. 이 기능은 복잡한 주제를 탐색하고 자동으로 보고서를 생성하는 연구 보조자 역할을 할 수 있습니다.
AI 에이전트의 미래 살펴보기이번 릴리스에서 Google은 Gemini 2.0을 기반으로 구축된 여러 연구 프로토타입 프로젝트도 시연했습니다.
프로젝트 아스트라(Project Astra): 다국어 대화 기능, 구글 검색, 렌즈, 지도 등 도구 사용 기능, 최대 10분의 대화 메모리 기능을 갖춘 만능 AI 비서 프로토타입이다. Project Mariner: 웹상의 다양한 유형의 정보를 이해하고 추론할 수 있으며 Chrome 확장 프로그램을 통해 사용자가 작업을 완료하는 데 도움을 줄 수 있는 브라우저 상호 작용 프로토타입입니다. WebVoyager 벤치마크에서는 83.5%의 최고 결과를 달성했습니다. Jules: GitHub 워크플로에 직접 통합되어 문제 해결 및 작업 실행을 지원할 수 있는 개발자용 AI 코드 에이전트입니다. 안전과 책임 있는 개발이러한 혁신을 추진하면서 Google은 보안과 책임 있는 개발의 중요성을 특히 강조합니다. 회사는 AI 에이전트의 안전한 사용을 보장하기 위해 여러 가지 조치를 취했습니다.
책임 및 안전 위원회(RSC)와 협력하여 잠재적인 위험을 식별하고 이해합니다. AI 지원 레드팀 방법을 개선하여 위험 평가 및 완화 기능을 향상합니다. 다중 모드 입력 및 출력을 위한 보안 평가 및 교육 메커니즘을 확립합니다. 프로젝트에 악의적인 명령에 대한 보호 추가 마리너 메커니즘의 미래 전망Gemini 2.0의 출시는 AI 개발의 중요한 이정표로 간주됩니다. Google은 고급 다중 모드 기능과 에이전트 기능을 결합하여 AI 기술 발전에 대한 야망을 보여줍니다. 이러한 새로운 기능은 점차 다양한 제품에 접목되면서 사용자들은 더욱 스마트하고 실용적인 AI 비서 서비스를 경험할 수 있게 될 것입니다.
하지만 구글 역시 AI 에이전트 기술이 아직 초기 단계이며, 기술을 지속적으로 개선하고 개선하기 위해서는 신뢰할 수 있는 테스터와의 협력을 통해 지속적으로 피드백을 수집해야 한다고 인정했습니다. 회사는 책임감 있는 방식으로 AI 기술 개발을 지속적으로 발전시켜 안전과 윤리 기준을 보장하는 동시에 새로운 가능성을 모색하기 위해 최선을 다하고 있습니다.
자세한 내용은 https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents를 참조하세요.
전체적으로 Gemini 2.0의 출시는 인공 지능 분야에서 Google의 강력한 강점과 향후 개발에 대한 예측을 보여줍니다. 이는 또한 인공 지능 기술이 사람들의 삶에 더욱 깊이 침투하여 사람들에게 더 편리하고 스마트한 서비스를 제공할 것임을 나타냅니다. 그러나 동시에 안전과 윤리 문제에는 여전히 지속적인 관심과 해결이 필요합니다.